15
n-Gramm in Python, vier, fünf, sechs Gramm?
Ich suche nach einer Möglichkeit, einen Text in n-Gramm aufzuteilen. Normalerweise würde ich so etwas machen wie: import nltk from nltk import bigrams string = "I really like python, it's pretty awesome." string_bigrams = bigrams(string) print string_bigrams Mir ist bewusst, dass nltk nur Bigramme und Trigramme anbietet. Gibt es jedoch …