Ralf: Rechtschreibeprüfung mit PHP

Hallo,

ich würde gern einen Text auf Schreibfehler prüfen. Dabei geht es mit lediglich darum herauszufinden wie viele (wahrscheinliche) Schreibfehler ein Text enthält. Korrekturvorschläge brauche ich keine. Das ganze sollte vollständig in PHP sein. Ich darf außer PHP Skripts nichts weiter installieren.

Hat schon mal jemand so etwas gemacht? Kennt Ihre eine (mögl. freie) Bibliothek?

Das ganze solle eine Art "Grobfilter" sein, der helfen soll Trollbeiträge schneller zu erkennen. Die haben es meist nicht so mit der Rechtschreibung (zumindest nach der Erfahrung im betreffenden Projekt).

Gruß
Ralf

  1. Hat schon mal jemand so etwas gemacht?

    Stell ich mir nicht sehr schwer vor. Extrahiere die einzelnen Wörter, mit regex oder Trennzeichen. Die Wörter prüfst du dann gegen eine Liste mit bekannten Wörtern.

    Das einzig schwierige dürfte sein, die Wörterliste zu finden. Die sollte ja möglichst alle vorkommenen Wörter enthalten, sonst ist das ganze wertlos. Und eine sinnvolle Grenze zwischen richtigen Wörtern und falschen. In diesem Forum hast du damit wahrscheinlich ein Problem denn es taucht ja gerne auch HTML Coder oder CSS oder sonst was ganz anderes auf, das kein erkennbar sinnvoller Text ist aber trotzdem rein gehört.

    1. Stell ich mir nicht sehr schwer vor. Extrahiere die einzelnen Wörter, mit regex oder Trennzeichen. Die Wörter prüfst du dann gegen eine Liste mit bekannten Wörtern.

      Das ist wäre natürlich das einfachste. Ich weiß nicht, ob in dieser Hinsicht ausgereiftere Programme so simpel vorgehen oder ob da z.B. nur gegen einen "Wortstamm" geprüft wird und eine Satzt von Regeln zur Wordbeugung hinzu kommt.

      Deswegen fragte ich hier nach. Vielleicht kennt ja jemand eine entsprechende Bibliothek.

      Das einzig schwierige dürfte sein, die Wörterliste zu finden. Die sollte ja möglichst alle vorkommenen Wörter enthalten, sonst ist das ganze wertlos.

      So eine Liste sollte ja jedes (Open- bzw. MS-) Office enthalten. Btw: weiß jemand, wie man die z.B. in eine SQL Tabell packt?

      Und eine sinnvolle Grenze zwischen richtigen Wörtern und falschen. In diesem Forum hast du damit wahrscheinlich ein Problem denn es taucht ja gerne auch HTML Coder oder CSS oder sonst was ganz anderes auf, das kein erkennbar sinnvoller Text ist aber trotzdem rein gehört.

      Dort wo ich es brauche, schreibt niemand Code, nur Sch****.

      Gruß
      Ralf