MudGuard: Volltextsuche mit Tippfehlertoleranz

Beitrag lesen

Hi,

für mein Projekt möchte ich noch die Suchfunktion dahingehend verbessern, dass sie auch ähnliche Schreibweisen akzeptiert.

evtl. ein angepaßter Soundex (das Original ist für englisch optimiert).
Bei soundex werden ähnlich klingende Buchstaben auf ein Zeichen abgebildet, z.B: b und p, d und t. Doppelte Buchstaben werden auf einen reduziert. Usw.

Für deutsche Texte müßte man das halt anpassen, ä kann z.B. wie e behändelt werden. Und es bietet sich an, ggf. auch Buchstabengruppen zu betrachten, z.B. ph wie f (und wie v und w) behandeln, th wie t (und d) usw.

Ich hab das schon mal gemacht, aber für meinen Arbeitgeber, darf daher nicht den kompletten Algorithmus rausrücken.

Wobei zu beachten ist:

Für den Suchbegriff ist das noch einfach, wenn größere Texte in DB-Spalten durchsucht werden sollen, ist das halt aufwändig. Die müssen halt entweder einmalig (bei Insert/update) in eine zweite Spalte konvertiert werden, oder jedesmal live in der Suche ...

Aber das dürfte auf die meisten "Ähnlichkeitssuchen" zutreffen.

cu,
Andreas

--
Warum nennt sich Andreas hier MudGuard?
O o ostern ...
Fachfragen per Mail sind frech, werden ignoriert. Das Forum existiert.