Als «beautifulsoup» getaggte Fragen

Beautiful Soup ist ein Python-Paket zum Parsen von HTML / XML. Die neueste Version dieses Pakets ist Version 4, importiert als bs4.


5
Python BeautifulSoup Parsing-Tabelle
Ich lerne Python requestsund BeautifulSoup. Für eine Übung habe ich mich entschieden, einen schnellen Parser für Parktickets in NYC zu schreiben. Ich kann eine HTML-Antwort erhalten, die ziemlich hässlich ist. Ich muss mir die schnappen lineItemsTableund alle Tickets analysieren. Sie können die Seite reproduzieren, indem Sie hier gehen https://paydirect.link2gov.com/NYCParking-Plate/ItemSearchund eine …

6
So finden Sie Tags mit nur bestimmten Attributen - BeautifulSoup
Wie würde ich mit BeautifulSoup nach Tags suchen, die NUR die Attribute enthalten, nach denen ich suche? Zum Beispiel möchte ich alle <td valign="top">Tags finden. Der folgende Code: raw_card_data = soup.fetch('td', {'valign':re.compile('top')}) Ruft alle gewünschten Daten ab, greift aber auch auf jedes <td>Tag mit dem Attribut zuvalign:top Ich habe es …

8
ImportError: Kein Modul namens BeautifulSoup
Ich habe BeautifulSoup mit easy_install installiert und versucht, das folgende Skript auszuführen from BeautifulSoup import BeautifulSoup import re doc = ['<html><head><title>Page title</title></head>', '<body><p id="firstpara" align="center">This is paragraph <b>one</b>.', '<p id="secondpara" align="blah">This is paragraph <b>two</b>.', '</html>'] soup = BeautifulSoup(''.join(doc)) print soup.prettify() Aber nicht sicher, warum das passiert Traceback (most recent call …


4
Nur Text aus diesem Element extrahieren, nicht seine untergeordneten Elemente
Ich möchte nur den Text aus dem obersten Element meiner Suppe extrahieren. suppe.text gibt jedoch auch den Text aller untergeordneten Elemente an: ich habe import BeautifulSoup soup=BeautifulSoup.BeautifulSoup('<html>yes<b>no</b></html>') print soup.text Die Ausgabe dazu ist yesno. Ich möchte einfach "Ja". Was ist der beste Weg, um dies zu erreichen? Bearbeiten : Ich …

3
Verwenden von BeautifulSoup, um ein HTML-Tag zu finden, das bestimmten Text enthält
Ich versuche, die Elemente in einem HTML-Dokument abzurufen, die das folgende Textmuster enthalten: # \ S {11} <h2> this is cool #12345678901 </h2> Das vorherige würde also übereinstimmen, indem es Folgendes verwendet: soup('h2',text=re.compile(r' #\S{11}')) Und die Ergebnisse wären ungefähr so: [u'blahblah #223409823523', u'thisisinteresting #293845023984'] Ich kann den gesamten passenden Text …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.