Halihallo rolfrost
- bei mir ist der gesamte Content in der INI, es gibt keinen Index, die Suche erfolgt direkt im Content.
Ist für diese Zwecke auch OK. Fulltext-Indizies sind nicht einfach zu erstellen :-)
Besonders wenn Kontext- und Positionsoperatoren wie z.B. NEAR dazukommen.
Aber
- es gibt die Möglichkeit, einen Index auf das Web zu erzeugen und in einer solchen INI abzulegen.
Du bist ein INI-Fanatiker, Rolf :-)
Ja, man kann Indizies damit schreiben.
Und mit den genannten Modulen kann ein SuchCGI auf diesen index aufsetzen.
Das dementiere ich nicht. Ich sage nur, dass Ini-Dateien eigentlich immer weniger
performant verarbeitet werden können, als Text-Files.
Meine Gedanken gehen dahin, dass diese Methode für eine Volltextsuche umständlich ist, weil: Wenn ich den Content in einer *DB* habe warum dann nicht gleich im Content suchen?
Nun ein Nachteil ist bestimmt, dass der Inhalt einer HTML-Datei nicht umbedingt für eine
Suche aufbereitet ist (oder kann bei dir wer nach "<body>" suchen?).
Hier noch ein interessantes Modul für DBI:
http://theoryx5.uwinnipeg.ca/CPAN/data/DBIx-TextIndex/DBIx/TextIndex.html
Oh, vielen Dank! - Kannte ich nicht und wollte es ziemlich genau so selber umsetzen,
jetzt hast du und der Author mir die Arbeit abgenommen :-)
Viele Grüsse
Philipp
RTFM! - Foren steigern das Aufkommen von Redundanz im Internet, danke für das lesen der Manuals.
Selbstbedienung! - Das SelfForum ist ein Gratis-Restaurant mit Selbstbedienung, Menüangebot steht in den </faq/> und dem </archiv/>.