Als «html-parsing» getaggte Fragen

Beim HTML-Parsing wird eine Serialisierung eines HTML-Dokuments verbraucht und eine Darstellung erstellt, mit der Sie programmgesteuert arbeiten können, z. B. um Daten daraus zu extrahieren. Die HTML-Spezifikation definiert einen Standardalgorithmus zum Parsen von HTML, der in allen gängigen Browsern implementiert ist.



9
Analysieren Sie eine HTML-Zeichenfolge mit JS
Ich habe nach einer Lösung gesucht, aber nichts war relevant. Hier ist mein Problem: Ich möchte eine Zeichenfolge analysieren, die HTML-Text enthält. Ich möchte es in JavaScript tun. Ich habe diese Bibliothek ausprobiert, aber es scheint, dass sie den HTML-Code meiner aktuellen Seite analysiert, nicht aus einer Zeichenfolge. Denn wenn …


3
Welcher HTML-Parser ist der beste? [geschlossen]
Diese Frage passt derzeit nicht zu unserem Q & A-Format. Wir erwarten, dass die Antworten durch Fakten, Referenzen oder Fachwissen gestützt werden, aber diese Frage wird wahrscheinlich zu Debatten, Argumenten, Umfragen oder erweiterten Diskussionen führen. Wenn Sie der Meinung sind, dass diese Frage verbessert und möglicherweise erneut geöffnet werden kann, …

7
Analysieren von HTML mit Python
Ich suche nach einem HTML-Parser-Modul für Python, mit dem ich die Tags in Form von Python-Listen / Wörterbüchern / Objekten erhalten kann. Wenn ich ein Dokument des Formulars habe: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div id='class'>Something here</div> <div>Something else</div> </div> </body> </html> dann sollte es mir eine Möglichkeit geben, …



5
Wie analysiere ich eine HTML-Seite mit Node.js.
Ich muss (serverseitig) große Mengen von HTML-Seiten analysieren. Wir sind uns alle einig, dass Regexp nicht der richtige Weg ist. Es scheint mir, dass Javascript die native Methode zum Parsen einer HTML-Seite ist, aber diese Annahme beruht darauf, dass der serverseitige Code alle DOM-Fähigkeiten von Javascript in einem Browser besitzt. …

8
So extrahieren Sie Zeichenfolgen nach einem Muster mit grep, regex oder perl
Ich habe eine Datei, die ungefähr so ​​aussieht: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items" primary-key="id"> <type="global" /> </table> Ich muss alles in den folgenden Anführungszeichen extrahieren name=, dh content_analyzer, content_analyzer2und content_analyzer_items. Ich mache das auf einer Linux-Box, also ist eine Lösung mit …

8
Wie normalisiere ich HTML in JavaScript oder jQuery?
Tags können mehrere Attribute haben. Die Reihenfolge, in der Attribute im Code angezeigt werden, spielt keine Rolle. Beispielsweise: <a href="#" title="#"> <a title="#" href="#"> Wie kann ich den HTML-Code in Javascript "normalisieren", damit die Reihenfolge der Attribute immer gleich ist? Es ist mir egal, welche Reihenfolge gewählt wird, solange es …

29
Können Sie Beispiele für das Parsen von HTML angeben?
Wie können Sie HTML mit einer Vielzahl von Sprachen und Analysebibliotheken analysieren? Bei der Beantwortung: Einzelne Kommentare werden in Antworten auf Fragen zum Parsen von HTML mit regulären Ausdrücken verknüpft, um die richtige Vorgehensweise aufzuzeigen. Aus Gründen der Konsistenz fordere ich das Beispiel auf, eine HTML-Datei für die hrefIn-Anker-Tags zu …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.