Statistica: Webalizer, Unterschied Hits, Files, Pages, Visits, Sites

Hi!

Wer kann mir bei folgenden Webalizer-Daten helfen?

Monthly Statistics
------------------

Total Hits                           9164
Total Files                          6760
Total Pages                          2535
Total Visits                          462
Total KBytes                        54065
Total Unique Sites                    433
Total Unique URLs                     238
Total Unique Referrers                145

Die Angaben Sites, URLs und Referrers gibt es nur für den Monat, die anderen auch für den Tag.

Was bedeuten die Angaben? Was ist z.B. der Unterschied zwischen Hits und Files oder Visits und Unique Sites? Die Website besteht aus einem Frameset mit mehreren Frames.

Eure Statistica

  1. Ich kann Dir zwar nicht bei Deinen Fragen helfen, aber die Daten bei webalizer sind in der Tat teilweise umständlich oder falsch formuliert..., wenn Du mal ein Tool sehen, willst, dass das ein oder andere besser kann, dann schau doch mal auf http://www.getchoo.com , das ist ein deutsches Tool, dass ich im Einsatz habe und mit dem ich sehr zufrieden bin..., auch mit dem Support!

  2. Hallo,

    Was bedeuten die Angaben? Was ist z.B. der Unterschied zwischen Hits und Files oder Visits und Unique Sites?

    Schau mal bei http://www.xwolf.de/artikel/def_statistik.shtml vorbei. Da werden einige Begriffe erklärt.

    Grüsse

    Andreas

  3. Hi Statistica,

    Wer kann mir bei folgenden Webalizer-Daten helfen?

    hast Du mal selbst eine Webalizer-Konfiguration gebaut? Dabei solltest Du diese Begriffe automatisch gelernt haben (weil Du einen Teil davon selbst definieren mußt).

    Total Hits                           9164

    Das sind die HTTP-Requests, die an den Server gestellt wurden.

    Total Files                          6760

    Nicht alle Requests führen zur Auslieferung von Dateien - "Files" sind diejenigen, die das tun, also genau diejenigen, die mit einem HTTP-Status 200 ausgeliefert wurden.
    (Kannst Du selbst vergleichen - der Webalizer liefert auch eine Liste der HTTP-Statuswerte mit den entsprechenden Trefferzahlen.)

    Total Pages                          2535

    Nicht alles, was angefordert wird, sind Seiten - einiges sind auch Bilder, JavaScript-Code, CSS-Definitionen etc.
    Was genau eine "Seite" ist, legst Du in der Webalizer-Konfiguration fest (durch eine Liste von Endungen für Dateinamen).

    Total Visits                          462

    Das ist ein bißchen "Voodoo".
    Der Webalizer versucht, Zugriffe von derselben "Site" (siehe unten) innerhalb eines bestimmten Zeitraums (welcher in seiner Konfiguration einstellbar ist) als zusammenhängende "Sitzung" zu interpretieren.
    Das ist insofern wildes Kristallkugelraten, als es weder mit nicht-transparenten Proxies klar kommt (solche, die eine Adreßübersetzung vornehmen, also im Webserverlog ihre eigene Adresse hinterlassen statt derjenigen des Client) noch mit IP-Adressen aus Pools oder mit wechselnden IP-Adressen innerhalb einer Sitzung ... mein Vorschlag: Vergiß diesen Wert einfach.

    Total KBytes                        54065

    Das sollte selbsterklärend sein. (Wobei das _nicht_ der TCP/IP-Traffic ist, den Deine Site tatsächlich verursacht - zähle mal pro Request ein KB drauf, dann kommt das ziemlich gut hin.)

    Total Unique Sites                    433

    Hm ... je nachdem, was im Webserver-Log steht (IP-Adresse oder DNS-Name des Client) und ob der Webalizer als "webazolver" läuft oder nicht (er kann selbst reverse DNS lookups machen, wenn man das einschaltet, also IP-Adressen in DNS-Namen übersetzen - das kostet allerdings viel Zeit, sowohl CPU- als auch Realzeit), versucht er hier, die Menge der eindeutigen Clients zu berechnen. (Mit denselben Probleme wie bei den "Sessions" oben - auch diese Zahl ist mit Vorsicht zu genießen.)

    Total Unique URLs                     238

    Das ist die Zahl der eindeutigen URLs, welche innerhalb Deines Servers angesprochen wurden.
    Wobei der Webalizer einerseits den Query-String ignoriert und andererseits bestimmte definierte Übersetzungen vornehmen kann - ich habe bei mir beispielsweise eingestellt, daß "/index.html" als Endung auf "/" abgebildet werden soll, weil das auf meinem Server generell der DirectoryDefault ist und mich ja nicht interessiert, mit welchem von mehreren möglichen Namen dieselbe Seite angesprochen wurde.

    Total Unique Referrers                145

    Dasselbe für die Menge derjenigen URLs, welche innerhalb des HTTP-Headers im Feld "Referer:" (sic!) mitgesendet wurden, also die "Vorgängerseiten" des jeweiligen Zugriffs.
    Durch die Referrer-Angaben kannst Du sehen, woher Deine Besucher kommen - von Suchmaschinen (dafür hat der Webalizer dann auch noch eine separate Suchbegriffs-Analyse-Funktion) bzw. von statischen Seiten (so erfährst Du, wer Links auf Deine Seiten gesetzt hat).

    Was ist z.B. der Unterschied zwischen Hits und Files

    Siehe oben (Files sind echt ausgelieferte Daten, Hits können auch Validierungen des Cache-Inhalts eines Browsers sein).

    oder Visits und Unique Sites?

    Visits sind "Besuche", Unique Sites sind "Besucher".

    Die Website besteht aus einem Frameset mit mehreren Frames.

    Das ist im obigen Kontext irrelevant.

    Viele Grüße
          Michael

    P.S.: Im Gegensatz zu anderen Beiträgen in diesem Thread finde ich den Webalizer ziemlich gut - man sollte seine Konfiguration sehr genau gelesen haben, um zu verstehen, was man damit alles machen kann. (Beispielsweise kann man über URL-Gruppierung sehr schön den Traffic thematischer Teilbereiche einer Domain zusammengefaßt analysieren.)

    1. Hi Michael!

      hast Du mal selbst eine Webalizer-Konfiguration gebaut? Dabei solltest Du diese Begriffe automatisch gelernt haben (weil Du einen Teil davon selbst definieren mußt).

      Nein, der Service wird von meinem Provider zur Verfügung gestellt.

      Die Website besteht aus einem Frameset mit mehreren Frames.

      Das ist im obigen Kontext irrelevant.

      Habe mir so nur die große Differenz zwischen visits und pages zu erklären verucht, war aber nur bedingt richtig ;-)

      P.S.: Im Gegensatz zu anderen Beiträgen in diesem Thread finde ich den Webalizer ziemlich gut - man sollte seine Konfiguration sehr genau gelesen haben, um zu verstehen, was man damit alles machen kann. (Beispielsweise kann man über URL-Gruppierung sehr schön den Traffic thematischer Teilbereiche einer Domain zusammengefaßt analysieren.)

      Wie kommt man denn an die Konfigurationsdatei ran, wenn das mein Provider zur Verfügung stellt, habe ich schlechte Karten, oder!? Gibt es so etwas wie .htaccess in Ergänzung zu httpd.conf beim Apache auch für den Webalizer, btw. wie läuft der denn, als Apache-Modul?

      Vielen herlichen Dank für die ausführlichen und informativen Ausführungen zum Thema!!!

      Statistica

      1. Hoi,

        Wie kommt man denn an die Konfigurationsdatei ran, wenn das mein
        Provider zur Verfügung stellt, habe ich schlechte Karten, oder!?

        Da wirst du wohl oder uebel den Provider anschreiben muessen.

        Gibt es so etwas wie .htaccess in Ergänzung zu httpd.conf beim
        Apache auch für den Webalizer,

        Nein.

        btw. wie läuft der denn, als Apache-Modul?

        Der Webalizer ist eine eigenstaendige Applikation, die die access-log
        auswertet.

        Gruesse aus mnbeeu,
         c.j.k

      2. Hallo,

        Wie kommt man denn an die Konfigurationsdatei ran, wenn das mein Provider zur Verfügung stellt, habe ich schlechte Karten, oder!? Gibt es so etwas wie .htaccess in Ergänzung zu httpd.conf beim Apache auch für den Webalizer, btw. wie läuft der denn, als Apache-Modul?

        Nein, an die Konfiguration des Webalizers kommst Du nicht ran. Auch wird der Provider sicher nicht bereit sein, Deine Statistik Deinen Wünschen anzupassen.

        Wenn Du aber Zugriff zum Accesslog hast und zufällig einen Linuxrechner irgendwo stehen hast, kannst Du Dir da selbst Webalizer drauf installieren (deinen Wünschen gemäß konfigurieren), Deine Accesslog drauf kopieren und laufen lassen.

        Allerdings finde ich, lohnt sich da der Aufwand nicht. Mir persönlich genügt die Information, die ich aus der Standardkonfiguration heraus lesen kann.

        Viele Grüße, Vedat

        1. Hallo Vedat,

          Wenn Du aber Zugriff zum Accesslog hast und zufällig einen
          Linuxrechner irgendwo stehen hast, kannst Du Dir da selbst
          Webalizer drauf installieren (deinen Wünschen gemäß
          konfigurieren), Deine Accesslog drauf kopieren und laufen
          lassen.

          ich habe das direkt auf meinem Webspace gemacht (zu dem ich Dialogzugang habe).

          "Installieren" des Webalizers heißt einfach "Hochladen des Binary via FTP" und fertig. (Wenn GD bereits installiert oder im Binary einkompiliert ist - bei mir war letzteres der Fall.)

          Natürlich muß man sich eine Konfiguration selbst schreiben, aber das ist es ja, was man ohnehin will: Selbst entscheiden, was die Auswertung tut. (Und nachdem ich das vorher schon mal für die Serverfarm unserer Firma gemacht hatte ...)

          Starten kann ich den Webalizer selbst via crontab oder shell.

          Allerdings finde ich, lohnt sich da der Aufwand nicht.

          Installieren geht ruckzuck.

          Konfiguration funktioniert ähnlich wie Apache - im Wesentlichen steht alles in der mitgelieferten Konfigurationsdatei drin, man macht ein paar '#'-Zeichen weg und dupliziert ein paar Zeilen, um darin URLs etc. anzupassen.
          Da habe ich einen Abend lang gelesen und gebastelt, bis es "schön" aussah.

          Mir persönlich genügt die Information, die ich aus der
          Standardkonfiguration heraus lesen kann.

          Mir nicht.

          Ich wollte insbesondere sehen, wie die Verteilung des Traffic auf meine thematischen Bereiche aussieht (was über Gruppierung von URLs prima funktioniert). Ich habe halt keine Subdomains.

          Außerdem hat mein Provider Webalizer 1.3 und sehr wenig Reports eingeschaltet, vor allem fast nirgendwo mehr als die Top10-Listen, keine funktionierende Opra-Browser-Erkennung usw.

          Viele Grüße
                Michael

      3. Moin!

        Wie kommt man denn an die Konfigurationsdatei ran, wenn das mein Provider zur Verfügung stellt, habe ich schlechte Karten, oder!? Gibt es so etwas wie .htaccess in Ergänzung zu httpd.conf beim Apache auch für den Webalizer, btw. wie läuft der denn, als Apache-Modul?

        Wenn du die Logfiles kriegen kannst, kannst du Webalizer auch zuhause laufen lassen. Den gibts für Linux und Windows (!). Allerdings ist er zugegeben nicht ganz so einfach zu bedienen - er läuft nämlich nur über die Kommandozeile. Es ist also ein etwas größerer Anfangswiderstand zu überwinden. Wenn aber erstmal alles eingerichtet ist, ist es ein Kinderspiel, die täglichen, wöchentlichen oder monatlichen Logfiles auszuwerten.

        Webalizer zum Download gibts unter http://www.mrunix.net/webalizer/ (Linux) oder http://www.medasys-lille.com/webalizer/ (Windows). Auf der ersten Seite ist unter Download ebenfalls eine Windows-Version erhältlich - die kenne ich nicht. Funktionieren wird sie genau wie alle anderen, aber wie dort angekündigt eben nur mit einer speziellen DLL. Schau einfach mal selbst.

        - Sven Rautenberg