Ich muss die Textdatei für ein Wort lesen und ihre Bedeutung zurückgeben. Jedes andere Dateiformat funktioniert ebenfalls.
Ich muss die Textdatei für ein Wort lesen und ihre Bedeutung zurückgeben. Jedes andere Dateiformat funktioniert ebenfalls.
Antworten:
Das Gutenberg-Projekt beherbergt das ungekürzte englische Wörterbuch von Webster sowie viele andere gemeinfreie literarische Werke. Eigentlich sieht es so aus, als hätten sie mehrere Versionen des Wörterbuchs, die aus verschiedenen Jahren urheberrechtlich geschützt sind. Der von mir verlinkte hat ein Copyright von 2009. Vielleicht möchten Sie sich auf der Website umsehen und die verschiedenen Versionen des Webster-Wörterbuchs untersuchen.
user1247808 hat einen guten Link zu: wget -c
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Wenn das nicht genug Worte für dich sind:
http://dumps.wikimedia.org/enwiktionary/latest/enwiktionary-latest-all-titles-in-ns0.gz (aktualisierte URL von Michael Kropats Vorschlag)
Obwohl sich dieser Dateiname ändert, möchten Sie die neueste Version finden ... die sich als große (sehr große) Textdatei herausstellt.
sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sql, um die veraltete Syntax zu ersetzen, bevor Sie es gegen eine Version 5.0+ von MySQL ausführen
Ich weiß nicht, ob es zu spät ist, aber ich dachte, es würde jemand anderem helfen.
Ich wollte dasselbe unbedingt ... fand es schließlich.
Vielleicht ist es nicht perfekt, aber für mich ist es angemessen (für meine kleine Wörterbuch-App).
http://www.androidtech.com/downloads/wordnet20-from-prolog-all-3.zip
Es ist keine Dump-Datei, sondern eine MYSQL-SQL-Skriptdatei
Die Wörter befinden sich in der Tabelle WN_SYNSET und das Glossar / die Bedeutung in der Tabelle WN_GLOSS
Here are some files related to natural language and chatterbot projects that we are making available to the public
sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql, damit es in der neuesten
Überprüfen Sie, ob diese kostenlosen Ressourcen Ihren Anforderungen entsprechen -