Skip to main content

So geht's besser: Drupal: Searchengine vs. Pagecounter

Ich weiß nicht wieso, aber immer kurz nachdem ich einen Blog geschrieben habe, weiß ich wie's besser geht. Aber so ist's halt.

Vor kurzem habe ich über meine erste Idee geschrieben, die Crawler aus meinem Pagecounter herauszuhalten. Die Idee war über IP-Ranges die Crawler zu identifizieren und zu ignorieren. Das hat funktioniert, ist aber ganz schön in Fleißarbeit ausgeartet. Ich habe ein wenig weiter gesucht und Drupal wäre ja auch nicht Drupal, wenn sich da nicht schon irgend einer drüber Gedanken gemacht hätte.

Viel einfacher und besser erledigt sich die Aufgabe mit den Modulen Browscap und Statistics Advanced Settings.

Das Browscap Module dient zur Identifizierung der Browser/Crawler. Es lädt eine Identifizierungsdatei von Gary Keith herunter und schreibt sie in die Datenbank. Danach können andere Module über Browscap die Browser identifizieren. Ich habe auch mal die Browserstatistik aktiviert, das ist quasi ein Pagecounter nur mit User-Agents. So kann ich erkennen, ob auch wirklich alle Crawler richtig identifiziert werden. Unten sieht man meine Liste. Google ist sehr, sehr fleißig.

Das Statistics Advanced Settings Modul arbeitet nun mit Browscap zusammen. Seine Einstellungen integrieren sich in die normalen "Zugriff auf Protokolleinstellungen" unter Reports. Hier kann man nun einstellen, dass Crawler nicht in die Statistik aufgenommen werden sollen. Als Bonus oben drauf ist es mit diesem Modul möglich wirklich nur unique Pageviews zu zählen. Also wenn der User ein zweites Mal, während der Session, auf die Seite geht, wird nicht gezählt. Ich weiß, ist Geschmackssache.

Zweites Schmankerl: Bestimmte Rollen aus der Statistik ausschließen. Praktisch, so verfälscht man nicht selbst den Pagecounter, wenn man z.B. auf Kommentare antwortet. (Ich liebe es auf Kommentare zu antworten *stichel ;-) )

Ja und das war's auch schon. Wie man es von Drupal kennt. Das meiste ist mit ein paar Klicks erledigt. Wartungsfrei - die neuen Browserinfos werden wöchentlich per cron aktualisiert. Hier mal meine Browserstatitik.

Man sieht, ist nicht ganz perfekt. Aber das ist bestimmt und Meilen besser, als eine selbst gepflegte IP-Liste. Aber was tut man nicht alles. Eine Anfrage, ob man falsch identifizierte Crawler melden kann, habe ich gerade abgeschickt. Es ist natürlich auch möglich das Ganze mit dem ipAuthenticator zu kombinieren. Das habe ich momentan aber nicht. Wenn ich Antwort auf meine Anfrage erhalten habe oder einen Weg gefunden habe, noch genauer zu zählen, berichte ich erneut.

Und habe ich schon erwähnt, dass ich mein Drupal liebe? So viele Module, so viele Möglichkeiten. By the way: wie gefallen euch die neuen "Fotorahmen" um den Bildern und das (noch etwas mickrige) roots_archiv?

Bild von  Twitter Trackbacks for So geht's besser: Drupal: Searc
[...] So geht's besser: Drupal: Searchengine vs. Pagecounter | roots_blog rootpanik.de/blog/rootpanik/20100324/so-gehts-besser-drupal-searchengine-vs-pagecounter – view page – cached Ich weiß nicht wieso, aber immer kurz nachdem ich einen Blog geschrieben habe, weiß ich wie's besser geht. Aber so ist's halt. Filter tweets [...]

Kommentar hinzufügen

Der Inhalt dieses Feldes wird nicht öffentlich zugänglich angezeigt. If you have a Gravatar account associated with the e-mail address you provide, it will be used to display your avatar.
  • Internet- und E-Mail-Adressen werden automatisch umgewandelt.
  • Zulässige HTML-Tags: <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd>
  • Zeilen und Absätze werden automatisch erzeugt.
CAPTCHA
Diese Frage hat den Zweck zu testen, ob Sie ein menschlicher Benutzer sind und um automatisierten Spam vorzubeugen.
Bild-CAPTCHA
Enter the characters shown in the image.
Inhalt abgleichen