Auge: Volltextsuche mit Tippfehlertoleranz

Beitrag lesen

Hallo

Damit erschlägt man aber keine Vertipper. Da wären auf der Tastatur nebeneinander liegende Buchstaben „ähnlich“.

vielleicht ist genau dafür dann diese Levenshtein-Distanz brauchbar? Hast Du weiterführende Hinweise?

Wenn ich das richtig lese, nur bedingt. Es vergleicht ja nur zwei Zeichenketten und gibt an, wieviele Ersetzungen stattfinden müssen, um aus Zeichenkette 1 Zeichenkette 2 zu machen.

Die Funktion berücksichtigt aber nicht, wie typische Fehleingaben aussehen. Vermutlich müssten verschiedene Funktionen kombiniert werden.

1. Die von Gunnar angesprochene Venutzung bemachbarter Zasten. (???)
2. Auslassng oder fälschliche Doppplung von Bucchsaben. (levenshtein)
3. Richtige™ Rächtschraibfehler. (soundex)
4. Unterschiedliche Schreibweisen z.B. wegen der Rechtschreibreform (bei Mudguard gefunden: aufwändig vs. aufwendig) (soundex)

Wie schnell das bei größeren Texten unerwünscht langsam wird, vermag ich nicht einzuschätzen. Vom Aufwand, das zu zufriedenstellend zu implementieren …

Tschö, Auge

--
Verschiedene Glocken läuteten in der Stadt, und jede von ihnen vertrat eine ganz persönliche Meinung darüber, wann es Mitternacht war.
Terry Pratchett, "Wachen! Wachen!"
ie:{ fl:| br:> va:) ls:[ fo:) rl:( ss:| de:> js:| zu:}
Veranstaltungsdatenbank Vdb 0.3