Wikiup:Technische Wünsche/Topwünsche/Abrufstatistik

aus Wikipedia, der freien Enzyklopädie
Screenshot von Pageviews in Version 2.0

Diese Seite dient der Dokumentation von Entwicklungsverlauf, Recherche und Diskussionen rund um den Wunsch „Integration des Abrufstatistik-Tools bzw. des nicht mehr funktionstüchtigen Wikiviewstats mit größerem Funktionsumfang in MediaWiki. Mobile Aufrufe sollten als neuer Aufruf gezählt werden, das Neuladen der Seite hingegen nicht.“ Anmerkungen und Fragen gerne auf der Diskussionsseite!

Hintergrund

Am Ende eines jeden Wikipedia-Artikels findet man den Link „Abrufstatistik“, bis Februar 2016 verwies dieser Link auf die Seite http://stats.grok.se/. Diese Seite und der dafür verwendete Datenservice wurden von zwei freiwilligen Wikipedianern betrieben. Das Tool wurde viel verwendet, hatte jedoch einige Einschränkungen & Fehler und war immer wieder nicht erreichbar. Ein ähnliches Tool mit mehr Funktionen war Wiki ViewStats, das jedoch seit einiger Zeit nicht mehr erreichbar ist.

Aktueller Status

Mittlerweile gibt es das neue Tool „Pageviews Analysis“ als Ersatz. Es wurde ursprünglich von User:MusikAnimal in seiner Freizeit entwickelt, mittlerweile arbeitet MusikAnimal für die Wikimedia Foundation und es gibt bei der WMF ein für das Tool verantwortliches Team. Die Seite bezieht seine Daten über die neue Pageview-API, welche vom Analytics-Team der WMF betrieben wird. Um ausfallsicher zu sein, läuft Pageviews Analysis auf 3 redundanten Servern der Wikimedia Foundation (T111053).

Features

  • Flexible Zeiträume können gewählt werden (Beispiel).
  • Mehrere Seiten können miteinander verglichen werden (Beispiel).
  • lineare & logarithmische Skala (Beispiel)
  • verschiedene Diagrammtypen & Einstellungsmöglichkeiten
  • Möglichkeit, die Daten herunterzuladen
  • Möglichkeit, mobile Webzugriffe zu berücksichtigen oder auszuschließen
  • Vergleich aller Sprachversionen eines Artikels (Beispiel)
  • aktuelle Listen der meistaufgerufenen Seiten (Beispiel)
  • Vergleich & Visualisierung der Abrufzahlen der Weiterleitungen (Beispiel)
  • Statistiken zur Wikipedia allgemein (Beispiel)
  • Vergleich der Zugriffszahlen aller Artikel einer Kategorie/Liste/etc. (Beispiel)
  • verfügbar über eine verschlüsselte Verbindung mit https

Zählung der Aufrufe

Das Tool greift die Daten in der Form auf, wie sie durch die „PageView API“ (Schnittstelle, über die die Aufrufzahlen „geholt“ werden) abgerufen werden. Jeder Aufruf wird als ein Aufruf gezählt. Mehrfachaufrufe durch ein und dieselbe Person werden daher ebenfalls jeweils als einzelne Aufrufe gezählt. Andernfalls bräuchte man einzigartige IDs (über das Speichern von Cookies im Browser), um einzelne Benutzer/Leser bzw. ihre Geräte identifizieren und voneinander unterscheiden zu können. Wenn z. B. bei einem Editathon alle von derselben IP Adresse auf denselben Artikel zugreifen oder in der Firma ein Gespräch über ein Thema entsteht und alle von ihren Rechnern denselben Artikel aufrufen, dann lässt sich das ansonsten nicht davon unterscheiden, ob ein- und derselbe Benutzer 10 x auf „Neuladen“ geklickt hat. Zudem stellt sich die Frage, ab wann ein „Neuladen“ ein „Neuladen“ ist – man müsste technisch eine Art Zeitfenster einrichten, und sich darauf einigen, wann es sich nicht mehr um „Neuladen“ handelt. Die Mehrfachaufrufe als einen Aufruf zu zählen, ist aus diesen Gründen sowohl rechtlich sehr problematisch als auch technisch komplex und wird sich daher nicht ändern lassen.

Zeitraum der Daten

Durch die Pageview-API werden Daten bis Juli 2015 zur Verfügung gestellt. Zuvor war die Art, wie Daten aufgezeichnet wurden, sehr unterschiedlich zu der, wie sie seit Juli 2015 aufgezeichnet werden. Die Daten von vor und nach 2015 zusammenzumischen, würde Ergebnisse liefern, die nicht ganz korrekt sein können, weswegen dies nicht gemacht werden kann. Es wird noch weiter recherchiert, ob es hier noch alternative Möglichkeiten geben könnte.

Feedback zur Umsetzung des Wunsches

Das Team der Software-Entwicklung von WMDE bat in den vergangenen zwei Wochen um eine kurze Rückmeldung, ob der Wunsch mit der Umsetzung des Pageview-Analysis-Tools (also die unten auf der Seite eingebundene Abrufstatistik) als erfüllt angesehen werden kann.

Das detaillierte Feedback findet sich auf der Diskussionsseite. Vielen Dank an alle, die sich Zeit genommen haben, eine Einschätzung abzugeben und/oder die neue Abrufstatistik noch einmal ausführlich zu testen!

Zufriedenheit mit der Abrufstatistik

  • Überwiegend sehr positive Einschätzung & Zufriedenheit mit der neuen Abrufstatistik: 14 Personen
  • Keine positive Einschätzung: 1 Person

(Die Rückmeldungen zur Funktion verteilen sich auf mehrere Abschnitte)

Verbesserungswünsche

  • Bessere Auswahlmöglichkeiten beim Zeitraum (1 Jahr etc.) - 4x (machbar)
  • Zugriff auf die Daten vor Juli 2015 - 4x (nicht machbar/begrenzt machbar, siehe oben)
  • Ein "Zurück"-Link/Button zum Artikel - 1x (machbar)
  • Mehrfachaufrufe sollten nur 1x gezählt werden - 1x (nicht machbar, siehe oben)
  • Möglichkeit, die Topviews der Namensräume getrennt voneinander anzusehen - 1x (nur begrenzt möglich, nicht weiter als bisher schon machbar)
  • Möglichkeit, die Topviews der Artikel in einer Kategorie und deren Unterkategorien anzusehen - 1x (momentan aus Performance-Gründen nicht inklusive Unterkategorien machbar, kann aber aufgrund einer Verbesserung der API künftig noch einmal neu überprüft werden)  Ok

Wie es weiter geht

Einbringen des Feedbacks in Version 2.0

In den letzten 2-3 Wochen wurden Gespräche mit dem Entwickler (MusikAnimal) der neuen Abrufstatistik geführt & die hier gemachten Anregungen/Wünsche besprochen.

Derzeit arbeitet MusikAnimal an einer Version 2.0 der Abrufstatistik - die Beta-Version findet sich hier. Wer sich noch an Wiki ViewStats erinnert, wird bemerken, dass in der Version 2.0 noch weitere Elemente eingebaut sind, die auch Wiki ViewStats bereitgestellt hatte: Im Unterschied zur gegenwärtigen Version ist die neue Version dreiteilig aufgebaut. Links finden sich Auswahlmöglichkeiten zum Zeitraum, Projekt etc. In der mittigen Hauptansicht werden die Seitenaufrufe dargestellt. Auf der rechten Seite findet man nun zusätzlich die Anzahl der Bearbeitungen und Bearbeiter, Anzahl der Beobachter, die Seitengröße sowie den Schutz-Status der Seite.

Das, was an den hier gesammelten Wünschen machbar ist, konnte in die Version 2.0 einfließen:

  • Bessere Auswahlmöglichkeiten beim Zeitraum: Beim Klick auf das "Dates"-Feld öffnet sich ein Menü mit mehreren Optionen, die die umseitig genannten mit beinhalten.
  • Zugriff auf die Daten vor Juli 2015: Aus den oben genannten Gründen können die "alten" und "neuen" Daten nicht miteinander vermischt werden. Version 2.0 beinhaltet daher einen Link zu den älteren Daten, bereitgestellt via grok.se und ein Hinweis zur Problematik der älteren Daten.
  • Ein "Zurück"-Button/Link zum Artikel: Dieser wird in der Version 2.0 enthalten sein.

Aufgrund des sehr guten Feedbacks und nach den Nachbesserungen wird der Wunsch mit der Umsetzung der Version 2.0 auf "erledigt" geschoben. Geplant ist, die Version 2.0 in ca. 1-2 Wochen zur Verfügung zu stellen.

Aktivierung der Version 2.0

Die Version 2.0 ist nun aktiv. Weitere Verbesserungen sind geplant: phab:tag/tool-labs-tools-pageviews. Der Wunsch wird mit der Version 2.0 als "erledigt" angesehen. (Stand: 15.11.2016)