florianmessner.com/blog

Sprachdienstleistungen Meßner

Kreative Logfile-Auswertungen

Traue keiner Statistik, die Du nicht selber gefälscht hast.

Anzeige


Warum florianmessner.com zwei unterschiedliche Logfile-Auswertungen veröffentlicht. (Mediadaten)

Dass keiner Statistik zu trauen ist, die man nicht selber gefälscht hat, gehört heutzutage zum etablierten Weltwissen. So zweifelhaft die Urheberschaft Churchills an diesem Satz sein mag, so sicher ist, dass diese Aussage mindestens ein Körnchen Wahrheit enthält.

Das gilt in besonderem Maße für Besucherstatistiken von Webseiten. Jeder Webmaster, der seine eigene Website einigermaßen ernst nimmt, will wissen, wie viele Besucher wie viele einzelne Seiten aufgerufen haben. Finden die geistigen Ergüsse unter Ausschluss der Öffentlichkeit statt? Oder hat die Website gar tausende von Besuchern pro Tag?

Um das herauszufinden, gibt es Logfiles. In den Logfiles wird jeder Seitenzugriff jedes Besuchers verzeichnet. Dabei spielt es keine Rolle, ob es sich um einen menschlichen Besucher handelt oder beispielsweise um einen Suchmaschinenbot.

Erst im Rahmen der Auswertung werden die raw logfiles gefiltert. Idealerweise fallen dann alle Suchmaschinenbots heraus. Erfasst werden sollten außerdem nur Zugriffe auf tatsächlich angezeigte Webseiten, also typischerweise htm- oder php-Dateien. Reine Bildateien dagegen sollten nicht als page impression gezählt werden.

Soweit so einleuchtend. Der Teufel steckt freilich auch hier im Detail: Wie definiert sich ein Besuch? Werden eigene Zugriffe des Webmasters ausgeschlossen? Letzteres wirkt sich bei High-traffic-Seiten nicht aus, kann aber ansonsten sehr wohl zu einer Verzerrung der Statistik führen. Daneben gibt es noch eine Reihe weiterer Parameter, die die Auswertung beeinflussen können.

Dabei ist naturgemäß die Versuchung immer groß, die Logfiles “großzügig” auszuwerten. V.a. dann, wenn der Webmaster die Logfile-Auswertung öffentlich zugänglich macht und bezahlte Werbebanner auf seiner Website platzieren möchte. Denn jeder potentielle Werbetreibende wird als erstes auf die Logfiles schauen. Was, nur 100 Besucher pro Tag? Werbetechnisch völlig uninteressant. Da biete es sich geradezu an, Zugriffe der Suchmaschinen in die Statistik einfließen zu lassen. Aus 100 werden so gut und gerne 1 000 tägliche Besucher, was die Website deutlich attraktiver erscheinen läßt.

Natürlich wird jeder seriöse Werbetreibender die zur Verfügung gestellten Zahlen kritisch hinterfragen. Tatsächlich? In der Praxis läuft es eher so, dass der erste Eindruck zählt. Belaufen sich die Besuchszahlen des vorangegangen Monats auf stolze 47 891 (florianmessener.com im Mai 2006 laut 1&1-Statistik), macht das erst einmal gewaltigen Eindruck.

Leider ergibt sich bei strikterer Auswertung ein Wert von 11 359.

Selbstverständlich sind es weder exakt 47 891 noch exakt 11 359 Besuche(r). Logfile-Auswertung ist keine exakte Wissenschaft und kann nur Näherungswerte liefern. Jede Auswertung hängt von den definierten Parametern ab. Offensichtlich aber geht es sehr wohl um die allgemeine Größenordnung. Es macht einen Unterschied, ob eine Website “nur” etwas über 10 000 oder knapp 50 000 Besuche(r) hat. Ja, das ist 5-mal so viel

Solange der Webmaster nur fürs eigene Ego die Logfiles auswertet, spielen solche krassen Abweichungen keine Rolle. Letztlich belügt sich der Webmaster nur selbst.

Werden die Zahlen aber aus Gründen der Werbekundenakquise veröffentlicht, wird es kritisch. Die Grenzen zwischen “kreativer Auswertung” und handfestem Betrug sind da mitunter fließend.

Absurderweise kann eine solche Fehlauswertung aber auch ganz und gar absichtslos sein. Nämlich dann, wenn sich der Webmaster auf automatisierte Logfile-Auswertungstools verläßt. Paradebeispiel ist die von 1&1 angebotene so genannte WebStatistik (florianmessner.com ist bei 1&1 gehostet). Die liefert zwar einige interessante Daten - nur leider sind die Ergebnisse gelinde gesagt mit Vorsicht zu genießen. 1&1 zählt nämlich nach eigener Aussage Zugriffe der Suchmaschinen als reguläre Besucher mit regulären Seitenaufrufen. Das führt zu nachgerade grotesken Zahlen. Laut 1&1 hatte florianmessner.com im Mai 2006 223 809 Seitenaufrufe (wow!). Nach der eigenen Auswertung: 54 150. Die Differenz erklärt sich v.a. daraus, dass bei der eigenen Auswertung (mit AWStats) weit über 100 Suchmaschinen nicht für die Besuchs- und Seitenauswertung erfasst werden. Allein der Google-Bot hat im Mai 2006 über 30 000 Mal “zugeschlagen”…
223 808 klingt beeindruckend, ist aber (derzeit ;-) ) eindeutig realitätsfern. 54 150 ist zwar deutlich weniger, aber immer noch mehr als manche Website jemals erreichen wird. Da die 54 150 Besucher (wie sich aus der Auswertung der Suchanfragen ergibt) überwiegend themenaffine Besucher sind (und nicht nur “Laufkundschaft”) haben die 54 150 im Zweifel einen höheren Werbewert als die 223 808…

Die schlechte Nachricht ist, dass es eine Reihe von Webseiten gibt, die ausschließlich derartige Fantasie-Zahlen veröffentlichen und es teilweise nicht für nötig befinden, auf die offensichtliche Unbrauchbarkeit der Zahlen hinzuweisen.

Um eine bessere Vergleichbarkeit mit anderen Websites zu ermöglichen, haben wir uns entschlossen, zusätzlich zu der eigenen manuellen Auswertung die Zahlen der 1&1-Statistik zu veröffentlichen.

Der Einsatz separater externer Auswertungstools ist aus datenschutzrechtlichen Gründen nicht möglich. Insbesondere Google Analytics ist wohl nicht vereinbar mit deutschen Datenschutzvorschriften. Immerhin werden bei Google Analytics personenbezogene Daten in der gängigen Surf-Praxis nicht nur ohne Einverständnis des Besuchers gesammelt (was schon für sich hochproblematisch ist), sondern sogar an Google-Server übertragen und anscheinend unbefristet gespeichert. Weist man seine Besucher auf eine solche Übertragung hin, ist das zwar besser als nichts, aber letztlich ist eine solche in der Praxis typischerweise nachträgliche Informierung denknotwendigerweise nicht ausreichend. Streng genommen müsste beim ersten Auruf irgendeiner Seite der Webpräsenz eine entsprechende Einverständniserklärung im Sinne einer vorherigen Zustimmung eingeholt werden. Das aber ist de facto nicht praktikabel. Insofern dienen die manchmal zu findenden Datenschutzerklärungen bestenfalls der Gewissensberuhigung des Webseiten-Betreibers, dürften einer rechlichen Überprüfung aber wohl nicht standhalten.

Die Zahlen der 1&1-Auswertung sind nur begrenzt belastbar, werden aber de facto von anderen Websites zur Werbekundenakquise eingesetzt. Mit gefakten Zahlen Eindruck schinden können wir auch… Gleichzeitig stellen wir aber auch weiterhin belastbares Zahlenmaterial zu Verfügung und vertrauen auf die Weisheit potentieller Werbekunden. :)

Im übrigen sind wir auch der Meinung, dass es so oder so ungeschickt ist, die Zugriffszahlen der Suchmaschinen miteinzubeziehen. Immerhin ist es durchaus realistisch, dass diese starken Schwankungen unterliegen. Wehe die Zugriffe durch die Suchmaschinen gehen aus welchem Grund auch immer zurück, dann entsteht plötzlich der fatale und falsche Eindruck, die Seite hätte ein paar tausend Besucher weniger als in den Vormonaten. In Wirklichkeit sind aber nur die Suchmaschinen-Zugriffe zurückgegangen. Insofern verfälscht die Berücksichtigung der Suchmaschinen auch die generelle Tendenz in der Besucherentwicklung.

Anzeige


Sat, June 10 2006 » Aktualisierungen

Leave a Reply

This is a captcha-picture. It is used to prevent mass-access by robots. (see: www.captcha.net)

You must read and type the 5 chars within 0..9 and A..F, and submit the form.

  

Oh no, I cannot read this. Please, generate a