Charles: Suchscript: Gewichtung der Fundstellen

Beitrag lesen

Nein, da es nicht um eine unscharfe Suche geht (Kann mich natürlich irren, nur hat sich der OP bis jetzt nicht wieder gemeldet). Es wird lediglich nach einer Möglichkeit gesucht die Fundstellen zu bewerten. Das das nicht so einfach ist sieht man ja schon bei Google.

Ich hab mich bis jetzt nicht wieder gemeldet, weil ich gemerkt habe, dass ich die Problematik entweder sehr sehr fundiert angehen muss. (Wozu ich keine Zeit habe und was auch m.E. den Aufwand für eine kleinere Website nicht lohnt.) Oder ich muss pragmatisch herangehen, Setzungen vornehmen, Suchvorgänge auf der Seite protokollieren und auswerten. Und damit habe ich jetzt angefangen.

  • Es gibt unterschiedliche Gewichtungen, je nachdem, ob ein Suchbegriff als ganzes Wort, nur am Wortanfang oder Ende gefunden wurde.
  • Es gibt Gewichtungen für die Fundstelle (Text, Header etc.)
  • Es gibt (sehr starke) Gewichtungen, je nachdem, wie viele von X Suchbegriffen gefunden wurden.

Noch nicht berücksichtigt habe ich Groß- und Kleinschreibung und auch nicht die Relation Suchtwörter/Anzahl der Wörter im Text. Ersteres nicht, weil ich einige Male bei Life-Suche erlebt habe, dass sehr viele User alles klein schreiben. Zweiteres nicht, weil auf der Website alle Artikel/Seiten etwa gleich gross sind.

Ich hatte allerdings schon vermutet, dass einige Betreiber von Websites, die mit eigenen Perl-Scripts oder modifizierter Freeware arbeiten, selbst schon mal auf das Problem gestossen sind und Lösungen erprobt haben. Es wird doch nicht auf jeder Website mit interner Suche mit Matt Wright's "simple-search.pl" gearbeitet, das  nur nach ganzen Wörtern sucht und für jeden Treffer schlicht 1 Punkt gibt. Aber hierzu kam in diesem Thread bisher leider nichts.