Charles: Suchscript: Gewichtung der Fundstellen

Beitrag lesen

Hi, ich habe ein kleines Perl-Script erstellt, das für die eigene Website eine Suchfunktion anbietet. Wegen der Besonderheiten der Website habe ich das Script selbst erstellt und keine Freeware übernommen bzw. angepasst. (Auf der Website sind auf einer HTML-Seite jeweils viele kleinere Artikel; das Suchergebnis liefert sofort die kompletten kleineren Artikel und nicht - wie üblich - nur die URL/Titles der gefundenen Seiten als Link und 2 Zeilen Anreisstext.)

Das Script arbeitet prima, jetzt habe ich aber folgendes Problem:
Für die Gewichtung der Fundstellen (welche Treffer/Artikel sind besser, welche schlechter?) muss ich zumindest 2 Kriterien berücksichtigen:
(1) der Suchbegriff als kompletttes Wort muss besser gewichtet werden als wenn der Suchbegriff nur am Anfang oder Ende eines Wortes steht (Wenn Suchbegriff = "Programm", dann muss die Fundstelle "Programm" besser bewertet werden als "Programmierer" oder als "gramm"
(2) wenn 2 Begriffe gesucht werden, dann muss ein Text, der 3x den ersten und 3mal den zweiten Begriff enthält, besser bewertet werden als ein anderer Text, der 6mal den ersten und 0mal den zweiten enthält.

Soweit so gut. Jetzt tue ich mich aber schwer, diese Kriterien mathematisch umzusetzen, also einigermassen sinnvoll zu quantifizieren.  Nach zwei Stunden Googeln habe ich bislang nichts dazu gefunden. Weiß jemand dazu Texte oder eigene Tipps?

Danke für jede Info!