Benutzer:Flominator/WikiBlame

aus Wikipedia, der freien Enzyklopädie
< Benutzer:Flominator
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 19. Juli 2022 um 18:36 Uhr durch imported>Gestumblindi(9787) (Änderung 224629762 von 2600:387:15:937:0:0:0:7 rückgängig gemacht; ?).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

WikiBlame ist ein Wikipedia-Tool von Flominator, mit dem automatisiert ermittelt werden kann, in welchen Versionen eines Artikels eine bestimmte Zeichenkette vorkommt. Von besonderem Interesse ist dabei die Version des ersten Vorkommens, um schnell den Urheber bzw. die Zusammenfassung und Quelle guter, unbelegter, fragwürdiger oder gar urheberrechtlich bedenklicher Artikelteile zu ermitteln. Dies kann zum Beispiel für Nachfragen bei Autoren, zum lizenzkonformen Kopieren von Artikelteilen oder für das Nachtragen von Einzelnachweisen notwendig sein.

Benutzung

Das Tool durchsucht die Versionsgeschichte eines Artikels nach einer Zeichenkette. Versionen, die den Suchbegriff enthalten, werden mit OOO markiert, während er in Versionen mit XXX fehlt. Versionen, die mit ??? gekennzeichnet sind, wurden übersprungen.

Einstellungen

Die folgenden Ausführungen beziehen sich auf die überarbeitete Benutzeroberfläche, die hier getestet werden kann. Die Dokumentation der derzeitigen Oberfläche findet sich in dieser Version.

Sprache und Projekt

Wikiblame kann zahlreiche Projekte der Wikimedia Foundation durchsuchen. Die URLs der Projekte sind alle nach dem Schema „http://sprache.projekt.org“ aufgebaut. In die Felder Sprache und Projekt werden also die entsprechenden Elemente der URL eingesetzt. Wenn ein Projekt keine Sprachversionen unterscheidet, wird als Sprache blank eingesetzt. Beispiele:

Artikel

Titel des Artikels, so wie er bei der normalen Lektüre eines Artikels angezeigt wird und innerhalb des jeweiligen Wikis verlinkt werden kann. Zum Beispiel: „Verschwörungstheorien zur Mondlandung.“

Suchbegriff

Stichwort oder Zeichenfolge, nach deren ersten Vorkommen gesucht wird.

Wenn kein Wikicode ([, ], {, }, *, #, '', ''', ==, ====, <, >, |) im Suchbegriff enthalten ist, wird nur reiner Text durchsucht. Will man also beispielsweise nach Interwikitags suchen, so genügt nicht „en:Artikelname“, sondern es muss „[[en:Artikelname“ benutzt werden. Vgl. auch die Option #Suche nach Wiki-Text erzwingen.

Suche nach Wiki-Text erzwingen

Wird diese Option aktiviert, so wird der eingegebene Text als Wikitext behandelt. Diese Funktion ist nützlich, wenn es sich beispielsweise um Teile eines Weblinks handelt.

Kleine Änderungen ignorieren (experimentell)

Hier werden die Versionen nicht durchsucht, bei denen beim Speichern die Option „Nur Kleinigkeiten wurden verändert“ aktiviert wurde.

Älteste Version

wurde nicht nach DATUM erstellt

WikiBlame durchsucht die Versionsgeschichte standardmäßig von der Gegenwart ausgehend in Richtung Vergangenheit. Das Startdatum ist mit dem heutigen Datum voreingestellt, um die gesamte Versionsgeschichte zu berücksichtigen. Durch die Wahl eines anderen Startdatums kann die Suche zeitlich eingeschränkt werden. Es werden alle Versionen vor 23:55 Uhr des ausgewählten Tages berücksichtigt.

  • Tipp: Um ein geeignetes Startdatum zu finden, bieten die Kommentare in der Versionsgeschichte und eine stichprobenartige Kontrolle verschiedener Artikelversionen einen guten Anhaltspunkt.
  • Tipp: Bei der Suchmethode „lineare Suche“ (s. u.) kann mit der Option „ältere zuerst“ (s. u.) die Suchrichtung geändert werden.

ist x Versionen älter als die aktuelle

Ignoriert die gegebene Anzahl von Versionen ab der zuletzt gespeicherten. Einfluss der Option „ältere zuerst“ (s. u.) muss ausprobiert werden.

Jüngste Version

wurde nicht vor DATUM erstellt

Bei der Suche werden keine Versionen berücksichtigt, die zeitlich vor diesem Datum erstellt wurden.

ist x Versionen älter als die aktuelle

Anzahl der Versionen, die durchsucht werden.

  • Tipp: Wenn die Anzahl der gefundenen Versionen genauso hoch ist wie die zu durchsuchende Anzahl, existieren möglicherweise noch weitere Versionen.
    • Bei binärer Suche werden in diesem Fall auch frühere Versionen durchsucht.

Suchmethode

WikiBlame unterstützt zwei unterschiedliche Suchmethoden:

binär

  • Bei der binären Suche wird die Version in der Mitte des zu durchsuchenden Zeitraums mit den Versionen am Anfang und Ende verglichen. Dann wird das Intervall mit der mutmaßlichen Fundstelle halbiert usw.

Wenn lange Versionsgeschichten mit hunderten oder tausenden Versionen durchsucht werden sollen, ist die binäre Suche deutlich schneller als die lineare Suche. In der Regel führt die binäre Suche sofort zum gewünschten Ergebnis.

  • Tipp: Sollte bei der binären Suche ein Revert gefunden werden, muss die Suche erneut von einem Zeitpunkt davor gestartet werden.
  • Tipp: Beim Überspringen von Versionen oder bei Verwendung der binären Suche bleibt naturgemäß eine Restunsicherheit, da die übersprungenen Versionen nicht geprüft werden.
Nach Löschung des Textes suchen

Bei Auswahl dieser Option innerhalb der binären Suche wird nicht nach der Bearbeitung gesucht, über die der Text in den Artikel eingefügt wurde, sondern nach jener, der zufolge der Text aus dem Artikel entfernt wurde.

linear

  • Bei der linearen Suche wird jede einzelne Version ab dem Startdatum (s. o.) in chronologisch ab- oder aufsteigender Reihenfolge (s. u.) verglichen.
stets x Versionen überspringen

Nur für lineare Suche: Ignoriert nach Prüfung einer Version die nächsten x Versionen, bevor wieder eine Version geprüft wird.

ältere zuerst

Nur für lineare Suche: chronologische Reihenfolge, in der die Versionsgeschichte durchsucht wird. Vom neueren zum älteren Eintrag oder umgekehrt.

Beispiele

Bsp1: Wikipedia

Wann tauchte in der deutschsprachigen Wikipedia im Artikel „Flohspiel“ zum ersten Mal das Wort „Cambridge“ auf?

  • Sprache: de
  • Projekt: wikipedia
  • Artikel: Flohspiel
  • Suchbegriff: Cambridge
  • alle anderen Optionen bleiben in der Standardeinstellung

Dies ergibt dann ausgefüllt und ausgeführt: WikiBlame.

Bsp2: Commons

Seit wann gibt es das Wort „Guidelines“ auf der Seite „Commons:Quality images candidates“?

  • Sprache: Commons
  • Projekt: wikimedia
  • Artikel: Commons:Quality images candidates
  • Suchbegriff: Guidelines
  • Versionen durchsuchen: 5000
  • alle anderen Optionen bleiben in der Standardeinstellung

Dies ergibt dann ausgefüllt und ausgeführt: WikiBlame.

Technik

Die technische Realisierung sieht folgendermaßen aus: Es wird eine Versionsgeschichte (wie diese) erzeugt, deren Beginn und Länge über die entsprechenden Eingabefelder verändert werden kann. Nun werden die Links zu den einzelnen Versionen in einem Array gespeichert und die Versionen in der HTML- oder Quelltext-Version einzeln heruntergeladen und mit dem Suchtext verglichen.

Hinweis: Du darfst diese Seite editieren!
Ja, wirklich. Es ist schön, wenn jemand vorbeikommt und Fehler oder Links korrigiert und diese Seite verbessert. Sollten deine Änderungen aber der innehabenden Person dieser Benutzerseite nicht gefallen, sei bitte nicht traurig oder verärgert, wenn sie rückgängig gemacht werden.
Wikipedia ist ein Wiki, sei mutig!