Reiner: Tester gesucht für neu aufgesetzten Server

Hi zusammen,

ich habe einen neuen Server aufgesetzt, der viel schneller, größer, schöner :-) ist.

Ich teste gerade an neuen Funktionen rum, d.h. es soll neben PDF, was auf dem alten auch schon geht, auch Word, Excel und Powerpoint durchsuchbar sein.

Nun weiß ich nicht, ob dies durchgängig klappt, d.h. es gibt ja vielle verschiedene Officeversionen. Das ist schwer alleine zu testen.

Also, wer möchte....

Viele Grüße,
Reiner

  1. Ich teste gerade an neuen Funktionen rum, d.h. es soll neben PDF, was auf dem alten auch schon geht, auch Word, Excel und Powerpoint durchsuchbar sein.

    Die alte Suchmaschine ist natürlich hier erreichbar.
    Sorry!

    Gruß
    Reiner

    1. hallo Reiner,

      Die alte Suchmaschine ist natürlich hier erreichbar. Sorry!

      Aha. Ich habe allerdings keinen Unterschied feststellen können.

      Ich bin grade ein wenig am Herumtesten, bisher hab ich nix Kritikwürdiges gefunden  -  naja  - bis auf den Postingtitel: wenn du "Irrtum" sagen willst, dann ist das ja nur einer, und dann heißt das, daß du ein "Erratum" nachschiebst :P
      (mich ärgert das zum Beispiel auch beim SELFHTML-Download-Angebot, weil da selbstverständlich viele "Errata" in ein großes "Erratum" gepackt wurden, aber im Text steht immer "es gibt ein Errata", grrrrmpf ...)

      tea culpa, tea maxima culpa ;-)

      Im übrigen: "errare humanum est"

      Grüße aus Berlin

      Christoph S.

      1. hallo Reiner,

        Die alte Suchmaschine ist natürlich hier erreichbar. Sorry!

        Aha. Ich habe allerdings keinen Unterschied feststellen können.

        Ich bin grade ein wenig am Herumtesten, bisher hab ich nix Kritikwürdiges gefunden  -  naja  - bis auf den Postingtitel: wenn du "Irrtum" sagen willst, dann ist das ja nur einer, und dann heißt das, daß du ein "Erratum" nachschiebst :P
        (mich ärgert das zum Beispiel auch beim SELFHTML-Download-Angebot, weil da selbstverständlich viele "Errata" in ein großes "Erratum" gepackt wurden, aber im Text steht immer "es gibt ein Errata", grrrrmpf ...)

        tea culpa, tea maxima culpa ;-)

        Im übrigen: "errare humanum est"

        Ich hatte ab dem 7. Schuljahr Franzöisch!
        C'est la vie!

        :-)

        Gruß
        Reiner

        1. hallo Reiner,

          Ich hatte ab dem 7. Schuljahr Franzöisch!

          Man merkt, daß dich das "franzöisch" verleitet hat, gelegentlich Konsonanten auszulassen *g*

          C'est la vie!

          C'est la tastature

          Grüße aus Berlin

          Christoph S.

          1. Ich hatte ab dem 7. Schuljahr Franzöisch!

            Man merkt, daß dich das "franzöisch" verleitet hat, gelegentlich Konsonanten auszulassen *g*

            Ja, ich bin berufsweise eher darauf getrimmt, Klammern wieder zu schließen, wenn ich sie vorher geöffnet hatte und immer schön ein Semikolon am Ende usw.
            Menschliche Sprache muß nicht ganz so exakt sein.
            Oder hast Du gerade einen Systemabsturz bei Dir verzeichnen können? :-)

            Gruß
            Reiner

          2. Hi,

            C'est la tastature

            C'est le clavier.

            Ähnlichkeiten mit dem Namen von Tasten-Musikinstrumenten sind nicht rein zufällig. ;-)

            cu,
            Andreas

            --
            Warum nennt sich Andreas hier MudGuard?
            Schreinerei Waechter
            Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
      2. Aha. Ich habe allerdings keinen Unterschied feststellen können.

        Aem, WIE testest Du denn?
        Mit "testen" meine ich nicht (nur) die eigentlichen Seiten auf dem Server. Ich dachte eher daran, daß sich ein paar Leute dort anmelden, die auch Excel+Co. auf Ihrem Webspace (oder sonstwo wissen, wo was sein könnte) und das mal prüfen.

        In rot steht ja oben, daß das noch ein Testserver ist. Keine Angst, man geht keinen Vertrag oder so ein.
        Zudem ist es auf der alten Möhre ja auch schon "für lau" machbar.

        Gruß
        Reiner

        1. hi,

          Aem, WIE testest Du denn?
          Mit "testen" meine ich nicht (nur) die eigentlichen Seiten auf dem Server. Ich dachte eher daran, daß sich ein paar Leute dort anmelden, die auch Excel+Co. auf Ihrem Webspace (oder sonstwo wissen, wo was sein könnte) und das mal prüfen.

          Genau das tue ich. Allerdings hatte ich keine Lust, meinen Rechner runterzufahren und Windows anzustellen  -  also läufts über VMWare. Ich entnehme deiner Anmerkung, daß du im log nix findest? Interessant. Ich hab auf meinem in VMWare laufenden WinXP (Host-System ist FreeBSD) durchaus Office2003 installiert, Word und Exel sind dabei.

          In rot steht ja oben, daß das noch ein Testserver ist. Keine Angst, man geht keinen Vertrag oder so ein.

          Schon gut, das hab ich bei dir auch vorausgesetzt.

          Grüße aus Berlin

          Christoph S.

          1. hi,

            Genau das tue ich. Allerdings hatte ich keine Lust, meinen Rechner runterzufahren und Windows anzustellen  -  also läufts über VMWare. Ich entnehme deiner Anmerkung, daß du im log nix findest? Interessant. Ich hab auf meinem in VMWare laufenden WinXP (Host-System ist FreeBSD) durchaus Office2003 installiert, Word und Exel sind dabei.

            sorry, war wohl zu voreilig...
            Wichtig ist nur die Email, dahin wird ein Paßwort geschickt um Zugriff auf die Einstellungen zu bekommen.

            In rot steht ja oben, daß das noch ein Testserver ist. Keine Angst, man geht keinen Vertrag oder so ein.

            Schon gut, das hab ich bei dir auch vorausgesetzt.

            Sollte nur nochmal gesagt sein.
            Auch bei freien Angeboten muß sowas sein, daß man dieses AGB-Geplänkel reinschreibt. Schon wegen Datenschutz usw.

            Gruß
            Reiner

  2. Hallo,

    den finde ich besonders gut:

    Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 169

    Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 397

    gruss

    --
    no strict;
    no warnings;
    man google
    1. Hallo,

      den finde ich besonders gut:

      Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 169

      Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 397

      Ja, danke! Weiß ich.
      Aber im Prinzip Dein Fehler, Du mußt schon die richtige ID im Suchscript angeben.
      Ich denke, Du hast "17" aus dem Beispiel eingetragen.

      Gruß
      Reiner

  3. Hi,

    ich habe zwar keine Lust zur Anmeldung, aber nur mal nebenbei bemerkt: Dein Server liefert keine Zeichenkodierung und in den Dokumenten fehlt eine Angabe auch. Du hast ein Faible für Fragezeichen? ;-)

    freundliche Grüße
    Ingo

    1. Hi,

      ich habe zwar keine Lust zur Anmeldung, aber nur mal nebenbei bemerkt: Dein Server liefert keine Zeichenkodierung und in den Dokumenten fehlt eine Angabe auch. Du hast ein Faible für Fragezeichen? ;-)

      meinst Du das:
      <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

      Welches Fragezeichen - in meinem Posting steht doch keines! ;-)

      Gruß
      Reiner

      1. Hi,

        meinst Du das:
        <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

        Welches Fragezeichen - in meinem Posting steht doch keines! ;-)

        nein. Ich redete von Deinem Server und den ausgelieferten Seiten. Sowas wie
        "W3 SiteSearch erm�glicht es Ihnen" macht sich nett...

        freundliche Grüße
        Ingo

        1. Hi,

          meinst Du das:
          <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">

          Welches Fragezeichen - in meinem Posting steht doch keines! ;-)
          nein. Ich redete von Deinem Server und den ausgelieferten Seiten. Sowas wie
          "W3 SiteSearch erm�glicht es Ihnen" macht sich nett...

          Achso, ja danke!
          Behebe ich gleich!

          Gruß
          Reiner

  4. Hi,

    Ich teste gerade an neuen Funktionen rum, d.h. es soll neben PDF, was auf dem alten auch schon geht, auch Word, Excel und Powerpoint durchsuchbar sein.

    Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

    Ja, so ein Ärger, warum bin ich nicht auf die Idee gekommen?

    Aber das will ja sowieso keiner, oder? Nein, im Gegenteil? Das verkauft sich wie geschnitten Brot?

    *grummel*

    ;-)

    Nun weiß ich nicht, ob dies durchgängig klappt, d.h. es gibt ja vielle verschiedene Officeversionen. Das ist schwer alleine zu testen.

    Wenn Du tatsächlich Libextractor und Konsorten genommen hast: das funktioniert sogar recht gut, ist bei mir häufig im Einsatz. Ist relativ versionsneutral was "geschlossene" Dateiformate angeht, etwas funktioniert immer und das reicht meist auch.

    so short

    Christoph Zurnieden

    PS:
    Wenn Du tatsächlich Libextractor benutzt: da ist auch Code von mir mit drin, also Umsicht bei evt Weitergabe, ich habe lange Ohren! ;-)
    CZ

    1. Hi,

      Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

      hättest Du das nicht heute morgen (vorausschauend) posten können?
      Das hätte mir viel Arbeit erspart! :-)

      Ich benutze ganz andere Tools, d.h. für jeden Medientyp eines.

      Zur Weitergabe: das steht unter GPL, oder?

      Gruß
      Reiner

      1. Hi,

        Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

        hättest Du das nicht heute morgen (vorausschauend) posten können?
        Das hätte mir viel Arbeit erspart! :-)

        Kommt drauf an, wie Du das implementiert hast.

        Ich benutze ganz andere Tools, d.h. für jeden Medientyp eines.

        Zur Weitergabe: das steht unter GPL, oder?

        Ja. Aber das braucht Dich für die Benutzung nicht zu interessieren, nur falls Du Code nicht nur veränderst sodnern auch noch weitergibst. Beides zusammen wohlgemerkt!

        Zumindest das online-Demo bringt mir bei DOC und PPS keinerlei Resultate. Ist das ein Fehler oder eine Beschränkung im Demo?

        Die Demo ist meines Wissens nicht aktuell und zudem aus einsehbaren Gründen beschränkt, ja.
        (Ich habe ein paar MS-Office Dateien hier (Excel, Word, PPT aber unbekannter version und Komplexität), da funktioniert alles, aber das heist ja leider nix)
        Ich hatte allerdings auch nicht ohne Grund "und Konsorten" dabei geschrieben ;-)
        Der Pluginmechanismus erlaubt aber die einfache Einbindung der verschiedensten Codes. Da kannst Du verschiedenes benutzen (solange OOo noch nicht wirklich derart benutzt werden kann) -- ein Auszug:
        http://www.45.free.net/~vitus/ice/catdoc/
        http://word2x.sourceforge.net/
        http://pair.mbl.ca/doc2xml/
        http://chicago.sourceforge.net/xlhtml/
        http://wvware.sourceforge.net/
        und noch viele andere mehr.

        Zumindest meine Kunden sind zufrieden ;-)

        so short

        Christoph Zurnieden

    2. Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

      Zumindest das online-Demo bringt mir bei DOC und PPS keinerlei Resultate. Ist das ein Fehler oder eine Beschränkung im Demo?

      Gruß
      Reiner

    3. Hallo Christoph,

      Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

      nochmals ich. Wenn ich dieses Tool richtig verstehe, extrahiert es doch "nur" die Metadaten raus, oder? D.h. bei einem Worddokument z.B. den Verfasser, Erstellungsdatum usw.

      Meine Umsetzung kann aber den kompletten Text erfassen.

      Viele Grüße,
      Reiner

      1. Hi,

        Da nimmt der Kerl einfach Libextractor (Vorsicht: das Paket hat über 6 MiB!), bastelt einen Service draus und will damit Kohle machen!

        nochmals ich. Wenn ich dieses Tool richtig verstehe, extrahiert es doch "nur" die Metadaten raus, oder? D.h. bei einem Worddokument z.B. den Verfasser, Erstellungsdatum usw.

        Ja.

        Meine Umsetzung kann aber den kompletten Text erfassen.

        Ah so, ja.
        Das ist mit libextract auch kein Problem, kostet nur etwas Zusatzarbeit zum Einbinden der dazu nötigen Programme. Sind ja alle schon da. Wie auch von mir gelistet. Es ist auch nicht weiter schwierig, da selbst ich das geschafft habe ;-)

        Sollten meine Ausführungen aus irgendwelchen Gründen dahingehend verstanden worden sein, das ich Deine kommerzielle Umsetzung schlecht machen möchte, dann ist das nicht korrekt. Ich möchte sie sogar ausdrücklich unterstützen, da es ein Service ist, der durchaus Marktchancen hat. Deshalb habe ich ja auch dieganzen Programme gelistet, die frei verfügbar sind und die ich auch benutze.
        Ich bin auch keine wirkliche Konkurenz und sowieso viel teuerer ;-)

        so short

        Christoph Zurnieden

        1. Hi,

          Ah so, ja.
          Das ist mit libextract auch kein Problem, kostet nur etwas Zusatzarbeit zum Einbinden der dazu nötigen Programme. Sind ja alle schon da. Wie auch von mir gelistet. Es ist auch nicht weiter schwierig, da selbst ich das geschafft habe ;-)

          ok, danke!

          Sollten meine Ausführungen aus irgendwelchen Gründen dahingehend verstanden worden sein, das ich Deine kommerzielle Umsetzung schlecht machen möchte, dann ist das nicht korrekt. Ich möchte sie sogar ausdrücklich unterstützen, da es ein Service ist, der durchaus Marktchancen hat. Deshalb habe ich ja auch dieganzen Programme gelistet, die frei verfügbar sind und die ich auch benutze.
          Ich bin auch keine wirkliche Konkurenz und sowieso viel teuerer ;-)

          nene, ich habe Dich da nicht falsch verstanden!
          Ich hoffe, ich bin auch nicht von dem einen oder anderen falsch verstanden worden. Es gibt zwar leider immer Leute, die meinen, Kommerz ist "generell" falsch. Naja, ich weiß ja nicht, wie die ihre Miete bezahlen...
          Aber da wir auch eine freie Version dazu anbieten, hatte ich auch keine Bedenken, daß hier zu posten.

          Ich wünsche ein schönes Wochenende!!!

          Ich fahre jetzt von Berlin wieder nach Hause. Da wird der Bär (sprich die Jecken) lossein. Bin gespannt (Grusel).

          Reiner

          1. Hi,

            gar nicht gesehen gestern, sorry.

            nene, ich habe Dich da nicht falsch verstanden!
            Ich hoffe, ich bin auch nicht von dem einen oder anderen falsch verstanden worden. Es gibt zwar leider immer Leute, die meinen, Kommerz ist "generell" falsch. Naja, ich weiß ja nicht, wie die ihre Miete bezahlen...

            Die mähen beim Vermieter den Rasen? ;-)
            Aber gut, Scherz beiseite:
            Keine vernünftige Lizenz verbietet kommerzielle Nutzung und das auch mit voller Absicht. Ich selber auch keine Probleme damit, das jemand meinen Code kommerziell nutzt, ich begrüße es und bin sogar jedesmal ein klein wenig stolz (sofern ich es erfahre), das man meine Produkte tatsächlich auch gebrauchen kann. Wundert mich immer noch jedesmal ;-)

            Aber da wir auch eine freie Version dazu anbieten, hatte ich auch keine Bedenken, daß hier zu posten.

            Das einzige Problem bei _nur_ einer rein kommerziellen Variante wäre gewesen, das der Post als reine Werbung angesehen worden wäre. Könnte man theoretisch und ganz streng genommen auch so noch, aber Deine Angaben waren ehrlich und korrekt und Du hast zudem nur um Funktionsprüfung des freien (auch werbungsfreien?) Services gebeten und zudem noch eine weiterführende Frage gestellt.

            Ich fahre jetzt von Berlin wieder nach Hause. Da wird der Bär (sprich die Jecken) lossein. Bin gespannt (Grusel).

            Was fährst Du auch von Berlin weg?
            Gut, das Bier da ist grausam, stimmt >;->

            so short

            Christoph Zurnieden

  5. Hello,

    Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 169

    Warning: mysql_num_rows(): supplied argument is not a valid MySQL result resource in /srv/www/htdocs/web0/html/w3s.php4 on line 397

    Harzliche Grüße aus http://www.annerschbarrich.de

    Tom

    --
    Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
    Nur selber lernen macht schlau
  6. Huhu Reiner

    Ich teste gerade an neuen Funktionen rum, d.h. es soll neben PDF, was auf dem alten auch schon geht, auch Word, Excel und Powerpoint durchsuchbar sein.

    Nun weiß ich nicht, ob dies durchgängig klappt, d.h. es gibt ja vielle verschiedene Officeversionen. Das ist schwer alleine zu testen.

    Also, wer möchte....

    Was genau soll man denn testen?
    Habe mich eben mal angemeldet, das hat alles geklappt, war einfach und der Crawler hat auch gleich losgelegt und schwubs ist die Suche einsatzbereit. Fein.
    Aber das wusstest Du vermutlich schon, es geht Dir wohl hauptsächlich um die Office-Dokumente?

    Mmmmh, da habe ich keine auf der betreffenden Seite.

    Kann man den Crawler per robots.txt vom indizieren bestimmter Bereiche abhalten?
    Habe bisher keien Information dazu finden können.
    Wenn nicht wäre das hiermit ein Feature-Request ;-)

    Viele Grüße

    lulu

    --
    bythewaythewebsuxgoofflineandenjoytheday
    1. Hallo Lulu,

      Was genau soll man denn testen?

      das war schon alles richtig!

      Habe mich eben mal angemeldet, das hat alles geklappt, war einfach und der Crawler hat auch gleich losgelegt und schwubs ist die Suche einsatzbereit. Fein.

      Danke, so soll es wohl auch sein, oder?

      Aber das wusstest Du vermutlich schon, es geht Dir wohl hauptsächlich um die Office-Dokumente?

      Eigentlich schon, aber andere Ideen usw. sind auch interessant.

      Mmmmh, da habe ich keine auf der betreffenden Seite.

      Macht nichts.

      Kann man den Crawler per robots.txt vom indizieren bestimmter Bereiche abhalten?
      Habe bisher keien Information dazu finden können.
      Wenn nicht wäre das hiermit ein Feature-Request ;-)

      Das ist leicht machbar. Ist nur ein anderes Modul.

      Ich habe Dir übrigens was freigeschaltet, was Dich interessieren dürfte. Kleine Belohnung für die schnell(st)e Reaktion!

      Gruß
      Reiner

      1. Ahoi

        Ich habe Dir übrigens was freigeschaltet, was Dich interessieren dürfte. Kleine Belohnung für die schnell(st)e Reaktion!

        Super, danke.
        Jetzt habe ich ja schon fast einen Pro-Account ;-)
        Werde das demnächst mal mit ein paar PDFs o.ä. versuchen.
        Noch ein Feature-Request (wie war das noch gleich mit dem Finger und dem Arm der dann ab ist ...)
        Bei der "broken link"-Ansicht wäre es nützlich wenn deutlicher zwischen internen und externen Links unterschieden wird.
        Im Moment werden die, so wie ich das sehe, blockweise angezeigt.
        Erst die externen und dann die internen.
        Mmmmh, als Sitebetreiber wären mir die internen 404er wichtiger, weil ärgerlicher.
        Bei den externen kann man die Schuld ja auf "die Anderen" schieben.

        Dann könnte man evtl. bei der Auflistung der eigenen Seiten im Konfigbereich jeweils die angezeigten URls um die Domain kürzen.
        Dann bleibt mehr Platz zur Anzeige längerer Pfadangaben.
        Mmmmh, wenn man mehrere Domains gelistet bekommt macht das natürlich schon Sinn die vollständige URL zu zeigen.

        Falls mir sonst noch was dazu ein- oder auffällt schreibe ich eine Email.

        Viele Grüße

        lulu

        --
        bythewaythewebsuxgoofflineandenjoytheday
  7. Hi zusammen,

    vielen Dank an alle, die getestet haben.
    Besonderen Dank an Lulu und Christoph Zurnieden für Hinweise und Ideen. Wir werden versuchen, daß nach und nach umzusetzen!

    Christoph, das Tool, das Du nanntest, ist wirklich ein kleiner Knaller! Kannte ich nicht.
    Allerdings werden wir das erstmal nicht einsetzen, mit Boardmitteln, die bei Linux schon dabei sind, geht das auch (fast) alles.
    Wir sind -zunächst- nur an den im Web oft vorkommenden Dokumenten interessiert. Im Wesentlichen ist das - neben HTML - PDF.
    Dann noch Excel und Word und in seltenen Fällen auch Powerpoint.
    Dein Tool ist aber nicht uninteressant, da es z.B. ratzfatz Bildgrößen ausgibt und ID3-Tags von MP3. Das ist aber meiner Meinung nach eher ein etwas anderes Anwendungsgebiet, also vielleicht schön für eine Mediendatenbank geeignet. Dennoch, wirklich toll!

    Vielen Dank an alle!

    Gruß
    Reiner