Benutzer:MorbZ-Bot

aus Wikipedia, der freien Enzyklopädie

Der MorbZ-Bot

Datei:Robot icon.svg Datei:Gnome-mime-application-pdf.svg

Der MorbZ-Bot durchsucht in unregelmäßigen Abständen alle geänderten Seiten nach verlinkten externen Dateien, bei denen die Dateibezeichnung (z. B. „PDF“) oder die Größe der Datei fehlt und ergänzt diese Angaben. Ich füge beispielsweise hinter einem Link ein: (PDF; 2,6 MB).
Dieser Benutzer ist ein Bot ohne Bot-Flag. Er wird von MorbZ betrieben.
  • Der Bot ist zurzeit außer Betrieb.
  • Der Bot wird automatisch betrieben, das heißt, er läuft unbeobachtet.
  • Sperre den Bot, falls er nicht korrekt funktioniert.
  • Kontrolliere die Arbeit des Bots.
  • Kontaktiere den Betreiber bei Fehlern.
  • Aufgabenbeschreibung:
    Fügt laut den Richtlinien für Weblinks Dateiinformationen wie „(PDF; 2,6 MB)“ hinter externen Links ein, die Zusatzsoftware erfordern.

Allgemeines

FAQ

Warum tut der Bot so etwas?

Wie auf der Seite Richtlinien für Weblinks erwähnt, sollte bei einem Link auf PDF- oder Multimediadateien darauf hingewiesen werden, dass ein externes Programm benötigt wird. Des Weiteren sollte auch die Größe der Datei hinter einem Semikolon angegeben werden, um böse Überraschungen bezüglich der Ladezeit zu vermeiden.

Zitat:

9. Datenformate, die Zusatzsoftware erfordern, beispielsweise PDF- oder Multimediadateien (OGG, MID, MP3, AVI, MPG usw.) bitte durch eine entsprechende Notiz hinter dem Link kennzeichnen. Dabei ist – wegen der Ladezeit – auch die Angabe der Dateigröße wünschenswert. Beispiel: „(PDF-Datei; 2,6 MB)“.

Dies wurde bis zum Einsatz des MorbZ-Bot nicht konsequent umgesetzt und nur schätzungsweise jeder zwanzigste PDF-Link war auch als solcher gekennzeichnet.

Warum sind Dateiinformationen sinnvoll?

Wenn auf einen Link geklickt wird, der zu einer Datei führt, welche ein externes Programm zur Ausführung benötigt, findet ein Medienbruch statt. Es ist daher üblich, bei solcherlei Dateien mit anzugeben, um was für einen Dateityp es sich handelt. Da die Dateigröße zwischen wenigen kB und mehreren hundert MB schwanken kann und Internetverbindungen verschieden schnell sind, ist auch die Angabe der Größe sinnvoll. Außerdem kann sich der Benutzer anhand der Dateigröße ein Urteil bilden, ob sich ein Aufruf der Datei für ihn lohnt.

Ist es wirklich nötig, auch bei sehr kleinen Dateien die Größe anzugeben?

Wenn die Größenangabe fehlt, bleibt die Ungewissheit, ob der Download der Datei den Nutzen rechtfertigt. Wenn eine Datei mit 12 kB beschrieben wird, fällt diese Ungewissheit und der Benutzer kann auch mal eben die Datei öffnen, weil er weiß, dass sie sehr klein ist und damit schnell geladen werden kann. „Aha, so klein? Dann kann ich sie ja mal öffnen.“ Eine Größenangabe ist demnach auch bei kleinen Dateien sinnvoll.

Technisches

  • Wenn keine Dateigröße ermittelt werden kann, z. B. weil der Link defekt ist, fügt der Bot auch keine Dateibezeichnung hinzu, sondern belässt den Link unverändert.
  • Der Bot erkennt Links in Einzelnachweisen und alleinstehende Links sowie die Linkvorlagen Cite web und Internetquelle.
  • Der Bot versucht zuerst die Dateigröße über das HTTP-Header-Feld „Content-Length“ zu ermitteln. Diese Angabe kann theoretisch eine falsche Dateigröße enthalten. In der Praxis zeigt sich aber, dass dieser Wert so gut wie immer richtig ist. Sollte es keinen „Content-Length“-Header geben, versucht der Bot die Datei herunterzuladen. Falls der Download 1 GB überschreiten sollte, bricht der Bot den Download ab und fügt keine Größenangabe hinzu.
  • Wenn nur eine der Angaben fehlt (Dateigröße oder Dateityp), sucht der Bot hinter dem Link nach der jeweils anderen Angabe und trägt die Fehlende daneben ein. Wenn direkt hinter dem Link Klammern sind, fügt der Bot die Angaben in diese ein. Andernfalls erstellt der Bot hinter dem Link Klammern mit den Angaben. Sollte der Link in Klammern sein, die direkt hinter dem Link schließen, werden die Angaben ohne weitere Klammern hinzugefügt.
  • Der Bot benutzt Dezimalpräfixe für Größenangaben (kB und MB zur Basis 1000).
  • Der Bot überprüft anhand der HTTP-Header auch den Mime-Typ des Dokuments. So ist sichergestellt, dass Dokumente beispielsweise nur dann als PDF gekennzeichnet werden, wenn es sich um ein solches Dokument handelt und nicht schon, wenn die Dateiendung .pdf ist.
  • Der Bot lädt die verlinkte Datei nicht komplett herunter, sondern lädt nur die HTTP-Header des verlinkten Dokuments.