Es gibt verschiedene Möglichkeiten, um HTML tags
aus einem NSString
In zu entfernen Cocoa
.
Eine Möglichkeit besteht darin, die Zeichenfolge in eine zu rendern NSAttributedString
und dann den gerenderten Text abzurufen.
Eine andere Möglichkeit ist die Verwendung der Methode NSXMLDocument's
- objectByApplyingXSLTString
Methode, um eine XSLT
Transformation anzuwenden , die dies ausführt.
Leider unterstützt das iPhone nicht NSAttributedString
oder NSXMLDocument
. Es gibt zu viele Randfälle und fehlerhafte HTML
Dokumente, als dass ich mich mit Regex oder Regex wohl fühlen könnte NSScanner
. Hat jemand eine Lösung dafür?
Ein Vorschlag war, einfach nach öffnenden und schließenden Tag-Zeichen zu suchen. Diese Methode funktioniert nur in sehr trivialen Fällen.
Zum Beispiel würden diese Fälle (aus dem Perl-Kochbuch-Kapitel zum gleichen Thema) diese Methode brechen:
<IMG SRC = "foo.gif" ALT = "A > B">
<!-- <A comment> -->
<script>if (a<b && a>c)</script>
<![INCLUDE CDATA [ >>>>>>>>>>>> ]]>