Felix Riesterer: Volltextsuche mit Tippfehlertoleranz

Beitrag lesen

Liebe(r) Wikipedia,

N-Gramm.

das erscheint mir kein praktischer, sondern eher ein theoretischer Hinweis zu sein. Wie ich schon schrieb, suche ich eine Lösung in Richtung Levenshtein-Distanz und eventuell Soundex-Mechanismus, um Ähnlichkeiten bei Wörtern zu erkennen. Mudguards Antwort war da schon eher in die Richtung, die ich denke.

Diese N-Gramme-Sache geht deutlich in ihrer Gründlichkeit über das hinaus, was ich überhaupt zu implementieren imstande bin und was als Größenordnung für mein Projekt überhaupt sinnvoll lösbar ist. Wenn ich den Artikel verstanden habe, ist diese Lösung eher etwas, das Häufigkeitslisten benötigt, wofür ich schlicht keine Ressourcen habe, um diese irgendwo vernünftig zu speichern.

Aber Danke für diesen Denkanstoß.

Liebe Grüße,

Felix Riesterer.

--
"Wäre die EU ein Staat, der die Aufnahme in die EU beantragen würde, müsste der Antrag zurückgewiesen werden - aus Mangel an demokratischer Substanz." (Martin Schulz, Präsident des EU-Parlamentes)