Benutzer Diskussion:ⵓ/Archiv/Vorlagen/Waybackarchiv

aus Wikipedia, der freien Enzyklopädie

Reihenfolge umstellen

Diese Vorlage sollte in der Reihenfolge umgestellt werden da sie in dieser Form verwirrt. Der Benutzer klickt mit hoher Wahrscheinlichkeit den nebensächlichen aber zuerst gelesenen Link zum Waybackarchiv Artikel um dann zu bemerken dass es dort nichts zum Thema zu lesen gibt. Logischer und benutzerfreundlicher wäre:

  • <Der Link zum Thema> (<Der Link zum WBA Artikel> vom <Datum>)

--Hippie2000 (Diskussion) 15:22, 2. Feb. 2013 (CET)

Das ist technisch nicht ganz einfach, aber ich werde gerne mal einige Versuche in diese Richtung durchführen (im BNR, denn diese Vorlage ist inzwischen über 1000 mal eingebunden)
Da mit dieser Vorlage der hinter dem Link stehende Titeltext mit Absicht nicht eingebunden ist, muss dieser aber immer hinten stehen. Was man machen könnte, ist die Wayback-url doppelt anzugeben, oder wenn es gelingt mit Hilfe einer substring()-Funktion den toten-URL rauszuschälen, den toten Link an die erste Stelle zu stellen. Substring ist aber recht schwierig, da entsprechende Textfunktionen vom Wiki-Parser nur recht mangelhaft unterstützt werden.
Wichtig wäre mir, dass die Vorlage weiterhin mit nur einem Parameter(url) funktionsfähig bleibt.  Frohes Schaffen, Boshomi ☕⌨☺ –  16:26, 2. Feb. 2013 (CET)
Zustimmung, der Link zum Waybackarchiv Artikel sollte nicht vorn stehen.
Aber auch die defekte Adresse nicht, sie sollte - das machen andere Vorlagen schon falsch - gar nicht als Weblink benutzbar sein, vor allem zum Schutz vor Malwareverteilern oder Suchmaschinenoptimierern nach deren Übernahme einer aufgegebenen Domain, so was wird ja nicht überwacht. --Thoken (Diskussion) 18:09, 2. Feb. 2013 (CET)
Das war dann auch der Grund warum ich die defekte URL nicht angezeigt habe.
Zum Hintergrund dieser Vorlage: Ich hab im November erstellt, da ich bemerkte, dass von den etwa 5400 mit Toter Link markierter Seiten gut 2000 erreichbar waren, also die Vorlage Toter Link in der Vergangenheit recht falsch eingesetzt wurde. Bei der Vorlage Toter Link habe ich die Inline-Variante eingebaut, da es damit möglich wurde, die URL direkt zu markieren, ohne wesentlich in die Gestaltung der Belege eingreifen zu müssen. Tatsächlich waren >2500 (47%) URLs austauschbar, und da wurden meist nur die einfachen Fälle bearbeitet.
Die direkte inline Markierung der Toten Links hat nun für die Wartung mindestens zwei entscheidende Vorteile: 1. Die defekten URLs lassen sich sehr leicht auffinden, und mit externer Software lassen sich dann auch Listen wie diese erstellen: Wikipedia:WikiProjekt_Weblinkwartung/Toter_Link#Möglicherweise erreichbare tote Links. Der zweit offensichtliche Vorteil liegt in der Tatsache, dass man nun die inline-markierten defekten Links recht einfach mit nur 4 Tastenanschlägen und 2 Mouse-Bewegungen durch einen Archivlink ersetzen kann.
Die Vorlage Waybackarchiv/WBA lässt sich mit Hilfe von Wikipedia:WikiProjekt_Weblinkwartung#Benutzer:TMg/weblinkChecker.js recht einfach in die Vorlage Webarchiv umwandeln. Alleine heute habe ich dieses Tool (für einen etwas anderen Zweck) gut 100 mal eingesetzt. Dieses Tool ersetzt jedenfalls alle im Artikel vorkommenden Einbindungen mit nur 2 Mouse-Clicks.
Dennoch würde ich auf WBA nur ungern verzichten, da diese bei der Bearbeitung von Listen wie der oben erwähnten effizienter und mit geringerer Fehleranfälligkeit belastet ist, als das Tool von TMg. (Beim weblinkChecker muss man jedenfalls die Ersetzungen recht genau überprüfen, damit nicht ungewollte Bearbeitungen unterrutschen. Allerdings hat das Tool auch Vorteile, die nur damit geerntet werden können.)
Ich schlage übrigens vor, die Vorlage Webarchiv in die Vorlage Internetquelle zu integrieren, so wie dies schon bei Toter Link der Fall ist, und die Vorlagen Webarchiv sowie Waybackarchiv nur für Wartungsarbeiten in Artikel zu verwenden, die dann regelmäßig durch Bots nach Internetquelle übertragen werden. Die derzeit verwendeten Archiv-Parameter in Internetquelle halte ich für recht benutzerunfreundlich. Frohes Schaffen, Boshomi ☕⌨☺ –  19:31, 2. Feb. 2013 (CET)
Eine selche Vorlage zu haben (und ein homogenes Konzept) ist sehr sinnvoll - und klar es ist schwer sie so zu realisieren da man nur an Teile des umgebenden Links kommt um diese zu sortieren. Auch ist die Trennung 'könnte wieder kommen' und ' kommt sicher nie mehr' wichtig. Nur wozu nicht den Link funktionsgleich austauschen und die Benennung von archive.org in den Hintergrund zu bringen. Dies könnte z.B. *optisch* in der Form von <ref> Nennungen bewerkstelligt werden, die einen Satz oder Konstrukt kaum behindern.
Zudem sollte man einplanen dass archive.org mittlerweile nicht nur Webseiten und Grafiken bereitstellt, sondern auch Dateiformate wie pdf in zip. Am Beispiel der ersten beiden Weblinks in Short Message Peer to Peer die ich ersetzte da die verlinkte Seite heute Domainhaien gehört und die Vorgänger sich klar verabschiedeten zeigt sich dieser Bedarf sehr deutlich. Das gezippte PDF ist die einzige Quelle dieses Dokument ohne Genehmigung "hotlinken" zu können. Mir fiel erst dadurch auf dass archive.org nun auch solche Dateien bereitstellt (war wohl Teil der kürzlichen Aufstockung von 160 auf 240 Mrd URLs.
<einschub>Ja im Oktober hatte ich mit der Verlinkung von pdf Dateien noch massive Schwierigkeiten, inzwischen sieht es hier deutlich besser aus. Machmal sind sogar mache Videos in guter Qualtität verlinkbar, meist ist aber die Übertragungrate zu gering. Frohes Schaffen, Boshomi ☕⌨☺ –  10:52, 3. Feb. 2013 (CET)
Dem Miteditor würde (falls es das noch nicht gibt) je eine Anleitung helfen, wie "dieses Formular nutzen wenn: 1) die Seite heute klar nichts mehr mit dem Thema zu tun hat... etc. Natürlich ist das nicht leicht. Diesen ersten Punkt versteht jeder. "domain expired" von "timeout" der temporär sein könnte zu unterscheiden kann man kaum erwarten. Ein paar allgemeinverständliche Aussagen sind aber möglich (sobald die Bedarfsfindung abgeschlossen ist).
<einschub>es ist tatsächlich so, dass sich der Zugriff auf archive.org-Seiten ständig ändert. Seiten die dort erreichbar waren, verschwinden kurzfristig (interene Serverprobleme) oder dauerhaft (z.B. wenn robots.txt entsprechend befüllt wird).  Frohes Schaffen, Boshomi ☕⌨☺ –  10:52, 3. Feb. 2013 (CET)
Das Thema Weblinks bedarf einer ständigen Wartung. Domainreseller kaufen ganz gezielt URLs die in Wikipedia verlinkt sind um vom Pagerank zu profitieren. Leider ist die Übernahme durch Domainreseller kaum technisch zu erkennen. Wer jemand von den 404 Bot Betreuern kennt kann vielleicht einen whois-diff Bot vorschlagen. Das würde die Abarbeitung erleichtern und die Sauberkeit enorm erhöhen. --Hippie2000 (Diskussion) 00:06, 3. Feb. 2013 (CET)
ACK. Ein wichtiges Projekt um die Wartbarkeit zu erreichen ist übrigens Vorlage_Diskussion:Weblink_ohne_Linktext, um fehlende Titeltexte einzutragen. Das macht das Auffinden und den Vergleich der Versionen deutlich einfacher. Beim ersten Durchgang der Recherche der mit Toter Link markierten Seiten, konnte ich bei rund 600 Seiten nichts finden, die zuvor einen HTML-Statuscode 200 geliefert hatten. Ich habe die Recherche aber immer recht schnell abgebrochen, wenn die Sache schwierig aussah. Mit etwas Zeitaufwand lässt sich auch hier noch einiges retten. Frohes Schaffen, Boshomi ☕⌨☺ –  10:52, 3. Feb. 2013 (CET)
Vielleicht sollte man aber auch nicht aus den Augen verlieren, dass Vorlagen nicht nur auf minimale Anzahl der nötigen Klicks und auf Botfreundlichkeit optimiert werden sollten. Mir macht es überhaupt nichts, wenn ich zweimal mehr kopiere oder zweimal mehr klicke, wenn am Ende die Darstellung in der Referenzliste verständlich und logisch ist. Ich finde den Archivparameter in Internetquelle/Citeweb überhaupt nicht benutzerunfreundlich, obwohl ich wirklich schon eine Vielzahl an defekten Weblinks ersetzt habe. So wie Internetquelle und Citeweb die Archivversionen bisher in der Referenzliste darstellen, ist einfach zu verstehen, sieht optisch ansprechend aus und ist auch sprachlich angenehm. Ich hoffe, daran werden jetzt nicht auch noch Änderungen vorgenommen, ohne vorher mit den Nutzern darüber zu diskutieren. Es wäre wirklich schön, wenn sich die Textausgabe der Vorlage mehr an Webarchiv orientieren würde. --Killikalli 16:01, 3. Feb. 2013 (CET)
Dem kann ich nur zustimmen Killikalli. In erster Linie ist der Zweck ja Information in menschenlesbarer Form zu liefern. Und ob das etwas mehr (einmalige) Arbeit ist sollten die Benutzer nicht (dauerhaft) büßen. Natürlich sollten dabei alle anderen Aspekte mit eingeplant werden. --Hippie2000 (Diskussion) 17:07, 4. Feb. 2013 (CET)
Mach einen Vorschlag wie du es gerne haben möchtest. Die Vorgabe für diese Vorlage wäre [<URL_Pos0>beliebliger Text (auch mit Links)<URL_PosEnde>] Titeltext(fix), ich werde dann sehen, wie sich das umsetzen lässt. Frohes Schaffen, Boshomi ☕⌨☺ –  20:03, 3. Feb. 2013 (CET)
Hallo Boshomi, leider habe ich Vorlagenerstellung keine Ahnung und kann deshalb mit der Vorgabe nicht viel anfangen. Mir gefällt die Variante, die unter Vorlage:Webarchiv#Beispiele im ersten Beispiel angegeben ist. Aber das hilft Dir wahrscheinlich nicht besonders weiter, oder?--Killikalli 20:24, 3. Feb. 2013 (CET)
Diese Variante von Webarchiv gefällt mir überhaupt nicht. Der Grund liegt in der fehlenden Angabe des Titel-Textes. Wenn der Link aus dem Webarchiv verschwindet, (z.B. wenn die Domain wiederverkauft wurde, und der neue Besitzer ein robots.txt erstellt) dann ist ein Ersatz kaum noch auffindbar. Ich bin der Meinung, dass die Titelangabe in Webachiv analog zu Internetquelle verpflichten werden sollte. Frohes Schaffen, Boshomi ☕⌨☺ –  20:47, 3. Feb. 2013 (CET)
Dafür gibt es doch den Parameter text bei webarchiv. Darin bringe ich normalerweise den Titel unter. Dann erscheint auch die url nicht mehr, sondern der Titel. Man kann das ja auch verpflichtend machen, aber das ist ja wieder ein anderes Thema ;).--Killikalli 20:55, 3. Feb. 2013 (CET)
Was genau meinst du mit [<URL_Pos0>beliebliger Text (auch mit Links)<URL_PosEnde>] Titeltext(fix)? Kannst du das bitte mal anhand eines Beispiels demonstrieren? --Flominator 12:34, 30. Mär. 2013 (CET)

Erreichbarkeit über die API

Neuer Aspekt: Neben der Erreichbarkeit durch den Leser über das Webinterface sollte auch die Erreichbarkeit der Information über die API hohe Priorität geniessen, auch daran hängen Programme mit denen Menschen lesen. Das scheint aber nicht so schwer zu sein. Bsp in dem diese Vorlage verwendet wird: http://de.wikipedia.org/w/api.php?action=query&prop=extlinks&titles=Short%20Message%20Peer%20to%20Peer&format=xml --Hippie2000 (Diskussion) 17:08, 4. Feb. 2013 (CET)

Vorlage:Webarchiv

Worin besteht der grundsätzliche Unterschied zwischen Vorlage:Webarchiv und dieser Vorlage? --Flominator 18:46, 23. Mär. 2013 (CET)

(Linkservice) --PerfektesChaos 20:41, 23. Mär. 2013 (CET)
  • Die Vorlage habe ich geschaffen, um auf effiziente Weise eine große Anzahl von falsch verwendeten Einbindungen von {{Toter Link}} zu ersetzen. Durch die Vorlagenweiterleitung WBA braucht man dafür nur 2 Mousemarkierungen und 4 Tastenanschläge. Im Jänner habe ich damit eine Effizienz erreicht die ich mit dem seit Februar hauptsächlich eingesetzten js-Tool (Benutzer:TMg/weblinkChecker.js) von TMg bisher noch nicht erreicht habe. Das Tool von TMg hat aber andere Vorteile die sich in Kombination mit den Arbeitslisten (Claims) von Wikipedia:WikiProjekt_Weblinkwartung/Toter_Link voll zum tragen kommen.
  • Das Tool von TMg ersetzt die Vorlage WBA/Waybackarchiv automatisch mit Webarchiv.
  • Bei der Vorlage Webarchiv gefällt mir nicht, dass die Parameter sehr deutlich von Internetquelle abweichen. Da wäre mir eine einfachere Austauschbarkeit lieber. Frohes Schaffen, Boshomi ☕⌨☺ –  22:27, 23. Mär. 2013 (CET)
Kannst du bitte anhand eines Beispiels erklären, wie dein Workflow aussieht und welche Werkzeuge du dafür benutzt? --Flominator 23:01, 23. Mär. 2013 (CET)
Die Grundlage ist der von der Vorlage {{Toter Link}} gelieferte Wartungslink der derzeit 3549 Vorkommen der Vorlage Toter Link in den Artikel registriert. Diese Links werden in eine SQL-Datenbank(PG9.2) eingelesen, neu hinzukommende werden auf den html-Status überprüft und in einer Wartungsliste ausgegeben.
  • Im November 2012 war dies mein erster Ansatz. Die Waybacklinks habe ich damals direkt aus der Wartungslist aus geöffnet, den Link auf die defekte url in die Zwischenablage genommen, und mit ctrl+F/F3 diesen Link im Artikel gesucht und markiert. Konnte ich einen passenden Link im Webarchiv finden, nahm ich den Waybacklink in die Zwischenablage, und kopierte diesen über die defekte URL. (1. Markierung, 1. Tastenanschlag im Artikel). Danach markierte ich die Vorlage Toter Link, und ersetzte diese mit WBA, (2. Markierung, 3 Tastenanschläge) Beispiel: Beispiel WBA
  • Seit Februar arbeite ich wie oben beschrieben hauptsächlich mit dem Tool von TMg. Die Arbeitslisten werden nun automatisch von der Datenbank erstellt und mit C&P in die Claims eingefügt. Das Tool von TMg ist der vorlagenbasierten Arbeitsweise deutlich überlegen, wenn die Listen pro Seite und nicht wie zuvor nach Domains erstellt. Da ist seit Februar nach dem First-in-first-out-Prinzip arbeite, ist dies klarer Weise überlegen. Bei den verbliebenen ungeprüften und geprüften URLs ist der Anteil mit hoher Trefferquote im Webarchiv natürlich auch schon beträchtlich gesunken. Immerhin wurden schon 52% aller registrierten Toten Links-Einbindungen seit November behoben, weshalb auch bei den verbliebenen Claims das Tool von TMg wegen der besseren Recherchemöglichkeiten deutlich überlegen ist.
  • Im Tool von TMg sind mit der Vorlage Toter Link markierte URLs gelb hinterlegt, und somit schnell auffindbar. Allerdings muss man die Link dennoch in der Wikisyntax suchen, um den Kontext zu lesen (hier entsteht ein Effizienzverlust gegenüber der Vorlagenarbeitsweise). Werden passende Ersatzlinks gefunden, werden diese in das Formular eingetragen und auf "Fertig" geklickt. Danach muss man nochmals kontrollieren, ob das Tool in erwarteter Weise gearbeitet hat, und dort nachbessern, wo Handarbeit notwendig ist. Der geringfügig höhere Aufwand mit dem js-Tool lohnt sich aber im Endeffekt durch die vereinfachte Recherche.  Frohes Schaffen, Boshomi ☕⌨☺ –  00:11, 24. Mär. 2013 (CET)
  • Wie genau gehe ich mit dem Tool vor, wenn ich die Vorlage Waybackarchiv setzen möchte? --Flominator 10:08, 25. Mär. 2013 (CET)
Mit dem Tool von TMg kann man {{Webarchiv}} auf recht komfortable Weise einfügen. Hat man das Tool einmal in commons.js eingefügt erscheint in der wikiEditor-ui-toolbar ein Symbol einer blauen Erde mit Füllfederspitze. Ein Click auf dieses Symbol öffnet sich ein Formular das alle Links der entsprechenden Seite enthält tumb. Ein Klick auf "Wayb." öffent ein Tab mit archive.org. Dort sucht man dann eine passende Version der Seite und fügt den gesamten Link in das Feld "Ersatz" ein. Es sollte immer auch das Beschriftungsfeld mit dem Linktitel ausgefüllt werden. Das kann man für beliebig viele Links wiederholen, und dann auf "Fertig" Klicken. Wichtig ist eine Kontrolle der automatischen Ersetzungen und gelegentlich einige Nachbesserungen, die vom Tool nicht erledigt werden.  Frohes Schaffen, Boshomi ☕⌨☺ –  18:16, 25. Mär. 2013 (CET)
Habe das hier mal versucht, bekam dort aber die Vorlage:Webarchiv eingefügt? --Flominator 08:17, 26. Mär. 2013 (CET)
Ja, habe ich oberhalb geschrieben, war wohl nicht gut formuliert. Da das Tool von TMg alle Waybackarchive-Links auch die direkt im Wikitext enthaltenen sowie die Vorlagen Waybackarchiv/WBA gegen Webarchiv. Frohes Schaffen, Boshomi ☕⌨☺ –  21:36, 26. Mär. 2013 (CET)
Kann dir nicht mehr folgen. Heißt das, du benutzt die Vorlage selbst auch nicht mehr? Gruß, --Flominator 17:13, 28. Mär. 2013 (CET)
Derzeit benutze ich diese tatsächlich selten, und durch das automatische Ersetzen durch das js-Tool werden die Einbindungen weniger. Allerdings verwende ich es schon gelegentlich, wenn z.B. das js-Tool komplett streikt, oder eine längere Lister direkt ersetzbarer Links vorhanden sind, und ich gerade wenig Zeit habe. Wenn wenig Recherche notwendig ist, ist bin ich mit der Vorlage effizienter. Frohes Schaffen, Boshomi ☕⌨☺ –  19:53, 28. Mär. 2013 (CET)
Die Vorlage Webarchiv ist, wie in der oben erwähnten LD dargestellt, viel besser. Sie erfordert aber etwas mehr Tipparbeit. ÅñŧóñŜûŝî (Ð) 00:08, 25. Mär. 2013 (CET)
Das stimmt bestimmt für all jene, die Copy und Paste noch nicht entdeckt haben und die ganzen Links per Hand eintippen müssen. Webarchiv hat übrigen auch einige recht unschöne Nachteile: es lässt sich nur mit recht großem Aufwand gegen Internetquelle austauschen, die die Parameter überhaupt nicht kompatibel sind. Ein Austausch von WBA gegen Internetquelle mit archiv-Parameter ist dagegen relativ einfach.  Frohes Schaffen, Boshomi ☕⌨☺ –  18:16, 25. Mär. 2013 (CET)

Zukünftige Verwendung

Wenn ich das oben richtig verstanden habe, wird diese Vorlage nur noch selten von Boshomi benutzt, da er das TMG-Tool hat.

  1. Könnten wir uns erst einmal darauf einigen, dass wir unter Vorlage:Waybackarchiv/Doku noch ein wenig besser herausarbeiten, dass diese Vorlage nicht mehr neu verbaut werden sollte?
  2. @Boshomi: in welchen Fällen nutzt du denn diese Vorlage noch?
  3. Könnten dir dort vielleicht Bookmarklets die Arbeit so erleichtern, dass du diese Vorlage nicht mehr benötigst? --Flominator 12:28, 30. Mär. 2013 (CET)
Das Tool ist super. Es ist m.E. auch allgemein nicht allzu schwer, statt dieser Vorlage die Vorlage Webarchiv zu nutzen. Die meiste Arbeit ist doch sowieso die Recherche. Syntax:
Statt wie bisher
[{{WBA|url=http://wayback.archive.org/web/<ZEITSTEMPEL>/<ALTEURL>}} <LINKTEXT>]
muss nur
{{Webarchiv|wayback=<ZEITSTEMPEL>|url=<ALTEURL>|text=<LINKTEXT>}}
eingefügt werden. Die bisherigen Einbindungen sollte ein Bot ersetzen. ÅñŧóñŜûŝî (Ð) 13:25, 30. Mär. 2013 (CET)
Welches Tool meinst du? Das von TMG oder das Bookmarklet? Letzteres findet sich unter Wikipedia:Technik/Browser/Bookmarklet#Internet Archive / Wayback Machine und unterstützt inzwischen auch die Generierung von Webarchiv-Vorlagen aus der aufgerufenen Archivseite. --Flominator 15:24, 30. Mär. 2013 (CET)
Das mit Bookmarklets muss ich mir mal ansehen. Grundsätzlich nutze ich persönlich gerne jegliche Unterstützung durch Scrips, allerdings sollte man nie die normalen Wiki-Nutzer aus den Augen verlieren, die keine js-Helferlein nutzen, und mit einem Haufen unnötiger Tipparbeit/unverständlicher Vorlagenparameter alleine gelassen werden.  Frohes Schaffen, Boshomi ☕⌨☺ –  09:23, 4. Mai 2013 (CEST)
Das von TMG, aber das andere schaue ich mir mal an. Womit auch immer, wir sollten alle konstruktiv auf ausschließliche Verwendung von "Webarchiv" oder "Internetquelle" (Archivlink) hinarbeiten. ÅñŧóñŜûŝî (Ð) 20:01, 30. Mär. 2013 (CET)
Wie schon oben beschrieben, halte ich die Vorlage Webarchiv als ebenso recht unglücklich gestaltet, da diese nur mit relativ großen Aufwand wieder in Internetquelle umgewandelt werden kann. Die Formatierung die Webarchiv vorgibt ist ja auch nicht das Gelbe vom Ei. Frohes Schaffen, Boshomi ☕⌨☺ –  09:23, 4. Mai 2013 (CEST)
Was schlägst du als weiteres Vorgehen vor? --Flominator 15:46, 2. Jun. 2013 (CEST)
Was Boshomi machen will, weis nur er. Evtl. ist die konsquente Nutzung von "Internetquelle" (Archivlink) der beste Kompromiss. ÅñŧóñŜûŝî (Ð) 15:02, 5. Jun. 2013 (CEST)
Gute Idee. Ich habe mal einen entsprechenden Hinweis eingebaut. --Flominator 17:52, 28. Jun. 2013 (CEST)

Datumsformat

Bei einstelligem Tagesdatum wird ein Format wie z.B. "03." mit führender Null erzeugt, was nicht den WP:Datumskonventionen entspricht. Lässt sich da etwas machen? -- Jesi (Diskussion) 17:44, 17. Apr. 2013 (CEST)