Benutzer:Flominator/WikiBlame
WikiBlame ist ein Wikipedia-Tool von Flominator, mit dem automatisiert ermittelt werden kann, in welchen Versionen eines Artikels eine bestimmte Zeichenkette vorkommt. Von besonderem Interesse ist dabei die Version des ersten Vorkommens, um schnell den Urheber bzw. die Zusammenfassung und Quelle guter, unbelegter, fragwürdiger oder gar urheberrechtlich bedenklicher Artikelteile zu ermitteln. Dies kann zum Beispiel für Nachfragen bei Autoren, zum lizenzkonformen Kopieren von Artikelteilen oder für das Nachtragen von Einzelnachweisen notwendig sein.
Benutzung
Das Tool durchsucht die Versionsgeschichte eines Artikels nach einer Zeichenkette. Versionen, die den Suchbegriff enthalten, werden mit OOO markiert, während er in Versionen mit XXX fehlt. Versionen, die mit ??? gekennzeichnet sind, wurden übersprungen.
Einstellungen
Die folgenden Ausführungen beziehen sich auf die überarbeitete Benutzeroberfläche, die hier getestet werden kann. Die Dokumentation der derzeitigen Oberfläche findet sich in dieser Version.
Sprache und Projekt
Wikiblame kann zahlreiche Projekte der Wikimedia Foundation durchsuchen. Die URLs der Projekte sind alle nach dem Schema „http://sprache.projekt.org“ aufgebaut. In die Felder Sprache und Projekt werden also die entsprechenden Elemente der URL eingesetzt. Wenn ein Projekt keine Sprachversionen unterscheidet, wird als Sprache blank eingesetzt. Beispiele:
- de und wikipedia für http://de.wikipedia.org, die deutschsprachige Wikipedia
- fr und wikibooks für http://fr.wikibooks.org, das französischsprache Wikibooks
- blank und wikisource für http://wikisource.org, das internationale Wikisource
- commons und wikimedia für http://commons.wikimedia.org, das internationale Wikimedia Commons
Artikel
Titel des Artikels, so wie er bei der normalen Lektüre eines Artikels angezeigt wird und innerhalb des jeweiligen Wikis verlinkt werden kann. Zum Beispiel: „Verschwörungstheorien zur Mondlandung.“
Suchbegriff
Stichwort oder Zeichenfolge, nach deren ersten Vorkommen gesucht wird.
Wenn kein Wikicode ([, ], {, }, *, #, '', ''', ==, ====, <, >, |) im Suchbegriff enthalten ist, wird nur reiner Text durchsucht. Will man also beispielsweise nach Interwikitags suchen, so genügt nicht „en:Artikelname“, sondern es muss „[[en:Artikelname“ benutzt werden. Vgl. auch die Option #Suche nach Wiki-Text erzwingen.
Suche nach Wiki-Text erzwingen
Wird diese Option aktiviert, so wird der eingegebene Text als Wikitext behandelt. Diese Funktion ist nützlich, wenn es sich beispielsweise um Teile eines Weblinks handelt.
Kleine Änderungen ignorieren (experimentell)
Hier werden die Versionen nicht durchsucht, bei denen beim Speichern die Option „Nur Kleinigkeiten wurden verändert“ aktiviert wurde.
Älteste Version
wurde nicht nach DATUM erstellt
WikiBlame durchsucht die Versionsgeschichte standardmäßig von der Gegenwart ausgehend in Richtung Vergangenheit. Das Startdatum ist mit dem heutigen Datum voreingestellt, um die gesamte Versionsgeschichte zu berücksichtigen. Durch die Wahl eines anderen Startdatums kann die Suche zeitlich eingeschränkt werden. Es werden alle Versionen vor 23:55 Uhr des ausgewählten Tages berücksichtigt.
- Tipp: Um ein geeignetes Startdatum zu finden, bieten die Kommentare in der Versionsgeschichte und eine stichprobenartige Kontrolle verschiedener Artikelversionen einen guten Anhaltspunkt.
- Tipp: Bei der Suchmethode „lineare Suche“ (s. u.) kann mit der Option „ältere zuerst“ (s. u.) die Suchrichtung geändert werden.
ist x Versionen älter als die aktuelle
Ignoriert die gegebene Anzahl von Versionen ab der zuletzt gespeicherten. Einfluss der Option „ältere zuerst“ (s. u.) muss ausprobiert werden.
Jüngste Version
wurde nicht vor DATUM erstellt
Bei der Suche werden keine Versionen berücksichtigt, die zeitlich vor diesem Datum erstellt wurden.
ist x Versionen älter als die aktuelle
Anzahl der Versionen, die durchsucht werden.
- Tipp: Wenn die Anzahl der gefundenen Versionen genauso hoch ist wie die zu durchsuchende Anzahl, existieren möglicherweise noch weitere Versionen.
- Bei binärer Suche werden in diesem Fall auch frühere Versionen durchsucht.
Suchmethode
WikiBlame unterstützt zwei unterschiedliche Suchmethoden:
binär
- Bei der binären Suche wird die Version in der Mitte des zu durchsuchenden Zeitraums mit den Versionen am Anfang und Ende verglichen. Dann wird das Intervall mit der mutmaßlichen Fundstelle halbiert usw.
Wenn lange Versionsgeschichten mit hunderten oder tausenden Versionen durchsucht werden sollen, ist die binäre Suche deutlich schneller als die lineare Suche. In der Regel führt die binäre Suche sofort zum gewünschten Ergebnis.
- Tipp: Sollte bei der binären Suche ein Revert gefunden werden, muss die Suche erneut von einem Zeitpunkt davor gestartet werden.
- Tipp: Beim Überspringen von Versionen oder bei Verwendung der binären Suche bleibt naturgemäß eine Restunsicherheit, da die übersprungenen Versionen nicht geprüft werden.
Nach Löschung des Textes suchen
Bei Auswahl dieser Option innerhalb der binären Suche wird nicht nach der Bearbeitung gesucht, über die der Text in den Artikel eingefügt wurde, sondern nach jener, der zufolge der Text aus dem Artikel entfernt wurde.
linear
- Bei der linearen Suche wird jede einzelne Version ab dem Startdatum (s. o.) in chronologisch ab- oder aufsteigender Reihenfolge (s. u.) verglichen.
stets x Versionen überspringen
Nur für lineare Suche: Ignoriert nach Prüfung einer Version die nächsten x Versionen, bevor wieder eine Version geprüft wird.
ältere zuerst
Nur für lineare Suche: chronologische Reihenfolge, in der die Versionsgeschichte durchsucht wird. Vom neueren zum älteren Eintrag oder umgekehrt.
Beispiele
Bsp1: Wikipedia
Wann tauchte in der deutschsprachigen Wikipedia im Artikel „Flohspiel“ zum ersten Mal das Wort „Cambridge“ auf?
- Sprache: de
- Projekt: wikipedia
- Artikel: Flohspiel
- Suchbegriff: Cambridge
- alle anderen Optionen bleiben in der Standardeinstellung
Dies ergibt dann ausgefüllt und ausgeführt: WikiBlame.
Bsp2: Commons
Seit wann gibt es das Wort „Guidelines“ auf der Seite „Commons:Quality images candidates“?
- Sprache: Commons
- Projekt: wikimedia
- Artikel: Commons:Quality images candidates
- Suchbegriff: Guidelines
- Versionen durchsuchen: 5000
- alle anderen Optionen bleiben in der Standardeinstellung
Dies ergibt dann ausgefüllt und ausgeführt: WikiBlame.
Technik
Die technische Realisierung sieht folgendermaßen aus: Es wird eine Versionsgeschichte (wie diese) erzeugt, deren Beginn und Länge über die entsprechenden Eingabefelder verändert werden kann. Nun werden die Links zu den einzelnen Versionen in einem Array gespeichert und die Versionen in der HTML- oder Quelltext-Version einzeln heruntergeladen und mit dem Suchtext verglichen.
Wikipedia ist ein Wiki, sei mutig!