Ich möchte einen Attributwert basierend auf seinem Namen drucken, zum Beispiel <META NAME="City" content="Austin"> Ich möchte so etwas tun soup = BeautifulSoup(f) //f is some HTML containing the above meta tag for meta_tag in soup('meta'): if meta_tag['name'] == 'City': print meta_tag['content'] Der obige Code gibt ein KeyError: 'name', ich glaube, …
Ich lerne Python requestsund BeautifulSoup. Für eine Übung habe ich mich entschieden, einen schnellen Parser für Parktickets in NYC zu schreiben. Ich kann eine HTML-Antwort erhalten, die ziemlich hässlich ist. Ich muss mir die schnappen lineItemsTableund alle Tickets analysieren. Sie können die Seite reproduzieren, indem Sie hier gehen https://paydirect.link2gov.com/NYCParking-Plate/ItemSearchund eine …
Wie würde ich mit BeautifulSoup nach Tags suchen, die NUR die Attribute enthalten, nach denen ich suche? Zum Beispiel möchte ich alle <td valign="top">Tags finden. Der folgende Code: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) Ruft alle gewünschten Daten ab, greift aber auch auf jedes <td>Tag mit dem Attribut zuvalign:top Ich habe es …
Ich habe BeautifulSoup mit easy_install installiert und versucht, das folgende Skript auszuführen from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup = BeautifulSoup(''.join(doc)) print soup.prettify() Aber nicht sicher, warum das passiert Traceback (most recent call …
Ich möchte nur den Text aus dem obersten Element meiner Suppe extrahieren. suppe.text gibt jedoch auch den Text aller untergeordneten Elemente an: ich habe import BeautifulSoup soup=BeautifulSoup.BeautifulSoup('<html>yes<b>no</b></html>') print soup.text Die Ausgabe dazu ist yesno. Ich möchte einfach "Ja". Was ist der beste Weg, um dies zu erreichen? Bearbeiten : Ich …
Ich versuche, die Elemente in einem HTML-Dokument abzurufen, die das folgende Textmuster enthalten: # \ S {11} <h2> this is cool #12345678901 </h2> Das vorherige würde also übereinstimmen, indem es Folgendes verwendet: soup('h2',text=re.compile(r' #\S{11}')) Und die Ergebnisse wären ungefähr so: [u'blahblah #223409823523', u'thisisinteresting #293845023984'] Ich kann den gesamten passenden Text …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.