Michael Schröpl: SELFHTML Suchmaschine gesucht

Beitrag lesen

Hi,

wo finde ich die Suchmaschine für's SELFHTML.

es ist in der Tat angedacht, sämtliche Dokumentformate des Self-Portals auf dieselbe Weise durchsuchbar zu machen wie das Archiv. (Und wahrscheinlich über ein gemeinsames Interface, das demjenigen der Archiv-Suchmaschine weitgehend entspricht und in welchem man z. B. per Checkboxen angeben kann, worin man suchen will.)

Die Archivbeiträge werden von einem Programm (Forum-Poster-Skript) erzeugt, haben also ein systematisches Aussehen. Zudem existiert bereits ein Programm (Schwanzabschneider), welches u. a. die zugehörigen Indexeinträge für die Suchmaschine erzeugt.
Diese beiden Voraussetzungen (systematisches Aussehen und automatische Indexierung) werden für alle übrigen Dokumenttypen auch angestrebt. Dabei ist die systematische Dokumentstruktur das größere Problem, weil die betreffenden Dokumente von (vielen verschiedenen) Menschen erstellt werden.
Es geht also darum, zunächst einmal ein suchmaschinentaugliches Format (Mindestanforderungen z. B. Erkennbarkeit von Verfasser, Datum der Erstellung bzw. letzten Änderung, Kapitelstruktur, Überschriften, relative Sprungmarken pro Kapitel etc.) zu definieren (die alle nichts mit dem *Aussehen* des Dokuments zu tun haben) und anschließend hunderte von Dokumenten in dieses Format zu überführen (bzw. bei strukturellen Fehlern entsprechende Meldungen zu produzieren). Insbesondere auch die Feature-Artikel, welche wiederum von beliebigen externen Autoren stammen ...

Wir wollen dasselbe wie Du - aber es wird noch eine Weile dauern ...

mfG - Michael