Ich möchte nur den Text aus dem obersten Element meiner Suppe extrahieren. suppe.text gibt jedoch auch den Text aller untergeordneten Elemente an:
ich habe
import BeautifulSoup
soup=BeautifulSoup.BeautifulSoup('<html>yes<b>no</b></html>')
print soup.text
Die Ausgabe dazu ist yesno
. Ich möchte einfach "Ja".
Was ist der beste Weg, um dies zu erreichen?
Bearbeiten : Ich möchte yes
auch beim Parsen von ' <html><b>no</b>yes</html>
' ausgegeben werden .