Bearbeiten: Ich habe kürzlich von einem Projekt namens CommonMark erfahren, das die Mehrdeutigkeiten in der ursprünglichen Markdown-Spezifikation korrekt identifiziert und behandelt. http://commonmark.org/ Es bietet hervorragende Unterstützung für die C # -Bibliothek.
Die Syntax finden Sie hier .
Die Quelle, die mit dem Download folgt, ist in Perl geschrieben , was ich nicht zu ehren beabsichtige. Es ist voller regulärer Ausdrücke und basiert auf MD5- Hashes, um bestimmten Zeichen zu entkommen. Daran stimmt einfach etwas nicht!
Ich bin dabei, einen Parser für Markdown hart zu codieren . Was ist Erfahrung damit?
Wenn Sie nichts Sinnvolles über das eigentliche Parsen von Markdown zu sagen haben, sparen Sie mir die Zeit. (Das mag hart klingen, aber ja, ich suche nach Einsicht, nicht nach einer Lösung, dh nach einer Bibliothek eines Drittanbieters.)
Um ein bisschen bei den Antworten zu helfen, sollen reguläre Ausdrücke Muster identifizieren ! NICHT eine ganze Grammatik zu analysieren. Dass die Leute dies in Betracht ziehen, ist foobar.
- Wenn Sie an Markdown denken, basiert es im Wesentlichen auf dem Konzept der Absätze.
- Daher könnte ein vernünftiger Ansatz darin bestehen, die Eingabe in Absätze aufzuteilen.
- Es gibt viele Arten von Absätzen, z. B. Überschrift, Text, Liste, Blockzitat und Code.
- Die Herausforderung besteht daher darin, diese Absätze zu identifizieren und in welchem Kontext sie auftreten.
Ich werde mit einer Lösung zurück sein, sobald ich finde, dass es sich lohnt, geteilt zu werden.