Ich habe kürzlich angefangen, mit der Verarbeitung natürlicher Sprache (NLP) unter Verwendung von Stanford CoreNLP zu experimentieren , und ich frage mich, wie NLP-geparste Daten für eine Text-Mining-Anwendung gespeichert werden können.
Eine Möglichkeit, die ich interessant finden könnte, besteht darin, die Kinder als Adjazenzliste zu speichern und rekursive Abfragen sinnvoll zu nutzen (Postgres unterstützt dies und ich habe festgestellt, dass es sehr gut funktioniert).
Ich gehe jedoch davon aus, dass es wahrscheinlich viele Standardmethoden gibt, die davon abhängen, welche Art von Analyse von den in diesem Bereich tätigen Personen im Laufe der Jahre angewendet wurde. Was sind die Standardpersistenzstrategien für NLP-analysierte Daten und wie werden sie verwendet?