Benutzer Diskussion:TMg/weblinkChecker
Babel: | ||
---|---|---|
| ||
Benutzer nach Sprache |
Zum Archiv |
Wie wird ein Archiv angelegt? |
Wunschliste von Thoken
- Wünsche: HTTP Error aktuell, evtl. aus Markierungen von Benutzer:Frog23/Dead Link Finder/de
- HTTP Error Check manuell, js-Link-Popup?
- Sortierbarkeit nach Domain, HTTP Error
- Suchmaschinen-Link für "<Linktext>"+site:<domain>, Maschinenwahl-Variable, default duckduckgo.com
- Vorschau Anzahl Treffer auf Spezial:Weblinksuche
- Edit-Vorschlag Botabschnitt Diskussionsseite, inklusive "URL nicht defekt"
- Hinweis Risiken defekt markierter Weblinks, Empfehlung Javascript & Co. abstellen ;-) Gruß --Thoken (Diskussion) 18:42, 26. Nov. 2012 (CET)
- Das Skript von Frog23 kannte ich noch nicht, vielen Dank. Ich hatte vor, so etwas einzubauen, allerdings nur per HEAD-Request mit einfachem AJAX. Frog23 nutzt ein Proxy-Skript. Das werde ich mir anschauen.
- Sortierungen und Filterungen werden sicher noch kommen, ja. Fürs erste ist es immer die Reihenfolge, in der die Links auch im Artikel stehen.
- Mehr Recherche-Möglichkeiten will ich auf jeden Fall anbieten, war mir aber unsicher, wie das gehen soll, ohne alles damit zu fluten. Dein Stichpunkt klingt gut, ich werde mir Gedanken dazu machen.
- Sehr gute Idee mit der Vorschau, zumindest eine ungefähre Zahl könnte ich anzeigen.
- Ich dachte, der Botabschnitt wird einfach entfernt, wenn er erledigt ist?
- --TMg 19:29, 26. Nov. 2012 (CET)
- PS: Die Vorschauidee ist in einer experimentellen Fassung drin. DuckDuckGo ebenso, vorerst noch nicht konfigurierbar. --TMg 20:07, 26. Nov. 2012 (CET)
- zu 1: Frog23's Skript könnte halt dem Benutzer tendenziell Zeit sparen, v.a. Wartezeiten auf Time-outs fallen nur beim ersten Mal an.
- zu 5: Stimmt. Rentiert sich eher nicht, wäre nur zur Erinnerung und bei nur teilweise abgearbeitetem Botabschnitt. Eine parallele Weblink-Historie aus Botabschnitten könnte aber zweckmäßig sein.
- Könntest du als nächstes die Bot-markierten Weblinks markieren oder selektieren, damit anderswo „das Rad nicht neu erfunden wird“?
- kleiner Bug (Test, wieviel Javascript ich verstehe, Vorsicht): im zweiten "else if (node.parent.type == 'Internetquelle'" ist "de" nicht definiert. Führt vermutlich zu diesem Ersatz von "titel" durch "title", hier (alte Version) nach Linktext-Edit hoffentlich leicht reproduzierbar.
- Wo sind in deinem Skript die Zeilen, die nach Klick auf "Fertig" die Editbox ändern? --Thoken (Diskussion) 10:42, 30. Nov. 2012 (CET)
- Ich werde Frog23 fragen, bevor ich mit einer Doppelentwicklung anfange.
- Das mit dem „Bot-markiertes markieren“ versteh ich nicht. Was soll ich da machen? Was wollt ihr da noch einmal redundant markieren und warum?
- Ja, da war ein Bug, sehr gut beobachtet. Danke.
- Meinst du die Zusammenfassungszeile? Such im Skript nach dem Wort „geändert“. --TMg 11:29, 30. Nov. 2012 (CET)
- Hab was gefunden, was anscheinend den Inhalt von wpTextbox1 verändert, danke.
- Ich wollte fragen: Könnten die von Defekter Weblink Bot auf der Diskussionsseite aufgeführten Weblinks in der linkCheckerBox deines Skripts markiert oder ausschließlich angezeigt werden ("von der Diskussionsseite dazu holen", nennst du das oben, nehme ich an)? --Thoken (Diskussion) 11:55, 30. Nov. 2012 (CET)
- Ja, das ist das „von der Diskussionsseite dazu holen“. Die entsprechenden Links werden mindestens rot markiert. --TMg 12:22, 30. Nov. 2012 (CET)
Tooltip
Das Tooltip des Icons lautet „Weblink-Helfer“, ist das Absicht? --Seth Cohen 17:01, 28. Nov. 2012 (CET) Also ich finde „Weblink-Checker“ besser. --Seth Cohen 16:14, 29. Nov. 2012 (CET)
- Es ist nur ein Name. Ich bin mir noch unsicher, wie das Werkzeug am Ende heißen wird. Es tut ja wesentlich mehr als nur zu „Checken“. Eher ist es ein universeller Weblink-Editor. --TMg 19:17, 29. Nov. 2012 (CET)
Substituierte Archivvorlagen
„Substituierte Archivvorlagen erkennen, vor allem damit die Links nicht doppelt angezeigt werden (Beispiel).“
Was ist denn mit substituierten Archivvorlagen gemeint? --Seth Cohen 00:30, 30. Nov. 2012 (CET)
- Na wenn es so wie dort im Text steht, statt die Vorlage:Webarchiv zu verwenden. Das will ich gern als zusammen gehörend erkennen. --TMg 11:21, 30. Nov. 2012 (CET)
Feature Request - Anzeige wikEdPreviewBoxOuter nach "Änderungen übernehmen" anzeigen
Ich klicke eigentlich sowieso immer auf das kleine Dreieck-Symbol "wikEdLocalDiff", dass die Änderungen im Code anzeigt (wikEdPreviewBoxOuter-Abschnitt). Ich denke dass es sinnvoll wäre, die Änderungen die durch das Script verursacht wäre automatisch angezeigt werden, um kontrollieren zu können, ob noch kleinere Nachbesserungen (z.B. hrsg, oder zugriff) anzupassen. Frohes Schaffen, Boshomi ☕⌨☺ – 20:11, 28. Mär. 2013 (CET)
- Ja, aber das ist nur ein Klick. Ich mag solche erzwungenen Ladeaktionen nicht, wenn gar nicht klar ist, ob der Benutzer das in diesem Moment wirklich will. Auch würde das eine Abhängigkeit zu einem Skript erzeugen, das nahezu niemand nutzt. Also eher nein. --TMg 16:45, 29. Mär. 2013 (CET)
Bug
Wenn man auf Änderungen übernehmen drückt, ohne etwas geändert zu haben verkürzt sich der Link diepresse.com/home/politik/aussenpolitik/473828/Syriens-Praesident-Assad_Ein-Anzug-der-Marke-Frieden?_vl_backlink=/home/politik/nahost/index.do
zu diepresse.com/
. Frohes Schaffen, Boshomi ☕⌨☺ – 20:05, 26. Sep. 2013 (CEST)
- Definitiv ein Fehler. Ich hatte ihn schon analysiert, aber noch keine Lösung gefunden. Mein Skript kommt irgendwie durcheinander, wenn eine Vorlage zwei Weblinks enthält. Beheben werde ich das auf jeden Fall, bitte Geduld. --TMg 12:35, 4. Okt. 2013 (CEST)
Leider noch einer:
Die letzte Änderung bewirkt bei mir, dass der Browser nach dem Click auf Änderung übernehmen sofort die aktuelle Seite verlassen will siehe:
(aktelles Beispiel. Bildschirmfoto Chromium) Das Problem tritt sowohl bei FF als auch unter Chrome auf. Bei Opera ist das Verhalten noch Problematischer: Dort wird zwar die Änderung übernommen, aber die Seite sofort verlassen (Opera springt dann auf die WP:Hauptseite).
Das Problem tritt aber nicht bei allen Seiten auf. Zwischen 18:30 und 19:15 gab es bei mehreren Edits keinerlei Auffälligkeiten. Frohes Schaffen, Boshomi ☕⌨☺ – 21:15, 4. Okt. 2013 (CEST)
- Der Bug hing mit irgend etwas auf der Seite Divinyls zusammen. Auf anderen Seiten funktioniert alles. Frohes Schaffen, Boshomi ☕⌨☺ – 21:57, 4. Okt. 2013 (CEST)
- Der Artikel Bart Simpson führt beim Versuch http://annieawards.org/23rdwinners.html durch http://annieawards.org/22nd-annie-awards auszutauschen ebenfalls zu einem Absturz (hier ladet auch Chromium ungefagt die Wikipedia Hauptseite) Frohes Schaffen, Boshomi ☕⌨☺ – 00:51, 5. Okt. 2013 (CEST)
- Dieser Bug dürfte unabhängig von den bearbeiteten Links sein. Ich vermute, dass hier irgend ein Fehler auf den betroffenen Seite, diesen Bug hier auslöst. Abgesehen von den genannten Beispielen ist mir das Problem seither nicht untergekommen, obwohl seither sicher schon 100fach eingesetzt. Frohes Schaffen, Boshomi ☕⌨☺ – 21:16, 12. Okt. 2013 (CEST)
- Ich glaube, die beiden Fehler hatten nichts miteinander zu tun. Behoben habe ich sie. Vielen Dank für die Meldung, damit konnte ich es gut nachvollziehen. Achtung, in den Beispielartikeln sind mir zahlreiche Fehler von dir aufgefallen: Weder die Vorlage:Cite journal noch die Vorlage:Literatur haben Archivparameter, trotzdem hast du welche eingesetzt. Das Skript weiß nicht so recht, was es da machen soll. Außerdem hast du jede Menge Schreibfehler bei den Parameternamen gemacht, „archvie…“ mit verdrehtem „i“ und „v“ und „web-archiv“ statt „archiv-url“ geschrieben. Ich habe dafür ehrlich gesagt wenig Verständnis. Zum einen, weil das Einsetzen dieser Parameter eine der Hauptfunktionen des Skripts ist und es gar nicht nötig sein sollte, da irgendwas von Hand einzutippen. Zum anderen, weil du das deinen eigenen Aussagen zufolge schon tausendfach gemacht hast und wissen solltest, wie die Parameter heißen. Und drittens, weil du die Fehler in der Vorschau sehen solltest. --TMg 11:28, 14. Okt. 2013 (CEST)
- Ich vermute dass zumindest einer der angesprochenen Fehler aus der Umwandlung der Vorlage WBA stammt. Die Vorlage WBA lässt sich als reine Inline-variante innerhalb anderer Vorlagen verschachteln. Die Tippos können durchaus von mir stammen, und weil ich dazu neige, verwendete ich damals sehr gerne die Vorlage WBA. (Bei nur 4 Tastenanschlägen kann nur wenig schief gehen) Ich werde bei Gelegenheit mal die betroffen Vorlagen mit dem Templatetiger durchgehen. Inzwischen verwende ich fast ausschließlich dieses Tool. Frohes Schaffen, Boshomi ☕⌨☺ – 12:40, 14. Okt. 2013 (CEST)
- Ich glaube, die beiden Fehler hatten nichts miteinander zu tun. Behoben habe ich sie. Vielen Dank für die Meldung, damit konnte ich es gut nachvollziehen. Achtung, in den Beispielartikeln sind mir zahlreiche Fehler von dir aufgefallen: Weder die Vorlage:Cite journal noch die Vorlage:Literatur haben Archivparameter, trotzdem hast du welche eingesetzt. Das Skript weiß nicht so recht, was es da machen soll. Außerdem hast du jede Menge Schreibfehler bei den Parameternamen gemacht, „archvie…“ mit verdrehtem „i“ und „v“ und „web-archiv“ statt „archiv-url“ geschrieben. Ich habe dafür ehrlich gesagt wenig Verständnis. Zum einen, weil das Einsetzen dieser Parameter eine der Hauptfunktionen des Skripts ist und es gar nicht nötig sein sollte, da irgendwas von Hand einzutippen. Zum anderen, weil du das deinen eigenen Aussagen zufolge schon tausendfach gemacht hast und wissen solltest, wie die Parameter heißen. Und drittens, weil du die Fehler in der Vorschau sehen solltest. --TMg 11:28, 14. Okt. 2013 (CEST)
- Dieser Bug dürfte unabhängig von den bearbeiteten Links sein. Ich vermute, dass hier irgend ein Fehler auf den betroffenen Seite, diesen Bug hier auslöst. Abgesehen von den genannten Beispielen ist mir das Problem seither nicht untergekommen, obwohl seither sicher schon 100fach eingesetzt. Frohes Schaffen, Boshomi ☕⌨☺ – 21:16, 12. Okt. 2013 (CEST)
https-Protokoll für Vorlagen Internetquelle, Cite web …
Siehe [1]. Analog halte ich die Änderung auch bei den Vorlagen Internetquelle usw. für sinnvoll, insbesondere wenn archive.org auch zum Hochladen genutzt werden kann. Frohes Schaffen, Boshomi ☕⌨☺ – 13:18, 16. Nov. 2013 (CET)
- Wollen wir es nur protokoll-relativ machen oder gleich https fest vorgeben? --TMg 19:46, 16. Nov. 2013 (CET)
- Ich würde gleich https vorziehen. Damit schließt man zwar jene Benutzer aus, die das Zertifikat ablehnen, das dürften aber sehr wenige sein, und die sollten wissen was sie tun. Protokollunabhängige Links sehen für viele Benutzer wegen der doppelten Slashes recht ungewohnt aus. Frohes Schaffen, Boshomi ☕⌨☺ – 20:26, 16. Nov. 2013 (CET)
- Hab ich mir angesichts der Ankündigung auch gedacht. Ist drin. --TMg 21:01, 16. Nov. 2013 (CET)
- Ich würde gleich https vorziehen. Damit schließt man zwar jene Benutzer aus, die das Zertifikat ablehnen, das dürften aber sehr wenige sein, und die sollten wissen was sie tun. Protokollunabhängige Links sehen für viele Benutzer wegen der doppelten Slashes recht ungewohnt aus. Frohes Schaffen, Boshomi ☕⌨☺ – 20:26, 16. Nov. 2013 (CET)
Vorlage:cite web mit archive.is Shortlink: Original-URL wird überschrieben
Parameter url (Original-URL) wird anscheinend auf den Wert von archiveurl gesetzt: FC_Chelsea&action=edit§ion=6
Bei archive.is Shortlinks wäre es transparenter, per Skript den Hashwert durch die Original-URL zu ersetzen, bei diesem FC Chelsea-Beispiel:
- archiveurl=http://archive.is/Dcmc → archiveurl=http://archive.is/www.fchd.btinternet.co.uk/lghist/fl/fl1951.htm,
also ungefähr das Umgekehrte zu dem, was jetzt passiert. Diese Shortlinks sind andererseits wohl eher selten.
nebenbei, Fix ohne Archiv möglich: http://www.fchd.info/lghist/fl1951.htm, Rotlink/Bot-Fehler[2] --Thoken (Diskussion) 13:14, 5. Dez. 2013 (CET)
- Nachtrag: weblinkChecker Archiv: dasselbe bei cite news(?!) --Thoken (Diskussion) 13:22, 5. Dez. 2013 (CET)
- siehe dazu Wikipedia:BA#Ersatz von Archive.is - Kurzlinks durch deren Langform. Per Bot wäre es möglich den exakten Link durch das Auslesen der Headerinfos zu finden. Gelegentlich differiert das gegen die alte Originalurl. Frohes Schaffen, Boshomi ☕⌨☺ – 18:05, 5. Dez. 2013 (CET)
- Definitiv ein Bug. Vielen lieben Dank für die Meldung, ich behebe das so schnell ich kann. --TMg 18:48, 5. Dez. 2013 (CET)
- Meinen Fehler habe ich gefunden und behoben. Nochmals Danke für die Meldung. Es hat etwas damit zu tun, was Boshomi beschreibt. Bei Archivlinks, in denen die Ursprungs-URL enthalten ist, verwerfe ich den URL-Parameter absichtlich und benutze statt dessen die URL aus dem Archivlink. Bei Kurzlinks ging das schief. Das mit dem Botfehler verstehe ich nicht. --TMg 23:59, 8. Dez. 2013 (CET)
- Behoben, danke für den Fix. "Das mit dem Botfehler" war hier überflüssig, eine Art private Notiz, sorry. --Thoken (Diskussion) 18:53, 9. Dez. 2013 (CET)
- Der Bug tritt immer noch auf: Siehe: Spezial:Permalink/125816190 (Änderungen übernehmen) Frohes Schaffen — Boshomi ☕⌨☺ 23:02, 26. Dez. 2013 (CET)
- Dort stand [http://www.webcitation.org/65ZxqeNmp História] im Quelltext. Meinst du das? Das wandle ich absichtlich in die Vorlagensyntax um. Den ursprünglichen Weblink muss man manuell ermitteln und einsetzen. So lange behält das Skript den Weblink bei, den es im Quelltext vorfand. Ich betrachte das als Aufruf zur manuellen Nachbesserung und möchte das gern so beibehalten. Oder hast du einen Vorschlag? --TMg 00:51, 29. Dez. 2013 (CET)
- Der Bug tritt immer noch auf: Siehe: Spezial:Permalink/125816190 (Änderungen übernehmen) Frohes Schaffen — Boshomi ☕⌨☺ 23:02, 26. Dez. 2013 (CET)
- Behoben, danke für den Fix. "Das mit dem Botfehler" war hier überflüssig, eine Art private Notiz, sorry. --Thoken (Diskussion) 18:53, 9. Dez. 2013 (CET)
Pipes ungewollt durch Gedankenstrich ersetzt
Siehe Special:Permalink/125595999. In diesem Fall werden Vorlage:lang die Pipes innerhalb durch „–“ (en-dash) ersetzt. Frohes Schaffen — Boshomi ☕⌨☺ 17:07, 28. Dez. 2013 (CET)
- Was soll die wilde Leerzeichensammlung (U+2003, U+200A) in deiner Signatur? Als ob deine Unicodeparade nicht genug wäre. Also ehrlich. Das mit dem Gedankenstrich hat seinen Sinn, schoss in diesem Fall aber übers Ziel hinaus. Ich habe es behoben. Danke. --TMg 00:38, 29. Dez. 2013 (CET)
- Das Einsezten der Gedankenstirche durch das JS ist eine gute Idee, und ich machte das auch öfters per Hand. Da ich das auch grundsätzlich für sinnvoll erachtete und im betroffene Edit sehr viel anderes ersetzt wurde, habe ich diese ungewollte Kleinigkeit im Fall einer Untervorlage auch nicht erkannt. Danke fürs Reparieren. Frohes Schaffen — Boshomi ☕⌨☺ 08:56, 29. Dez. 2013 (CET)
Protokoll-rel. URL wird nicht gefunden
im dritten Absatz dieses Abschnitts (alte Version): <ref>[//www.wotdb.info/ wotdb.info] ...
--Thoken (Diskussion) 21:41, 9. Feb. 2014 (CET)
- Das liegt tatsächlich daran, dass ich Protokoll-relative URLs noch gar nicht berücksichtige. Zum einen, weil sie nur innerhalb von Klammern funktionieren (Test: //wikipedia.de vs. [3]) und ich das berücksichtigen müsste. Zum anderen, weil ich davon ausgehe, dass gekürzte URLs seltener und meist auch verlässlicher sind als die 1:1 kopierten. Aber du hast Recht, ich müsste die mit aufnehmen. --TMg 11:43, 21. Apr. 2014 (CEST)
archive.is nach archive.today
Ich nehmen an, du hast es schon geahnt, nun ist es soweit, der erste Wechsel des Domainnamens von archive.is nach archive.today. Das war vermutlich nicht der Letzte. Die Vorlage Webarchiv habe ich bereits angepasst. Frohes Schaffen — Boshomi ☕⌨☺ 00:20, 16. Apr. 2014 (CEST)
- Manchmal hasse ich es, Recht zu haben. Ich habe umgestellt. Bitte gib Bescheid, falls ich etwas übersehen habe. --TMg 11:37, 21. Apr. 2014 (CEST)
- Danke! Soweit ich da die Blog- und Twittereinträge richtig interpretiere, wird die .is Domain wohl bald abgeschaltet. Ich hab inzwischen die Header der Shortlinks eingelesen, damit diese sinnvoll auf Langlinks umgestellt werden können. Ich fürchte aber, dass das in massenhaft Handarbeit ausartet, da eine beträchtliche Menge der Shortlinks ungeprüft per Bot eingefügt wurden. Jeder einzelne Link macht dann fast so viel Aufwand die die Suche nach defekten Weblinks. Zur Unterstützung der manuellen Arbeit wäre eine farbliche Unterlegung der „archiv.is/shrtlnk“-URLs für mich sehr hilfreich, da sich mein Workflow hier kaum von dem des Fixen toter Links unterscheiden dürfte. (Da habe ich mich nach inzwischen rund 10000 gefixten Links nur mit diesem Tool schon gut daran gewöhnt) Frohes Schaffen — Boshomi ☕⌨☺ 11:59, 21. Apr. 2014 (CEST)
- Den Wunsch habe ich leider noch nicht verstanden. Erklär mal kurz, wie du auf Langlinks umstellst, vielleicht lässt sich das sinnvoll (halb-) automatisieren. --TMg 23:51, 25. Apr. 2014 (CEST)
- Danke! Soweit ich da die Blog- und Twittereinträge richtig interpretiere, wird die .is Domain wohl bald abgeschaltet. Ich hab inzwischen die Header der Shortlinks eingelesen, damit diese sinnvoll auf Langlinks umgestellt werden können. Ich fürchte aber, dass das in massenhaft Handarbeit ausartet, da eine beträchtliche Menge der Shortlinks ungeprüft per Bot eingefügt wurden. Jeder einzelne Link macht dann fast so viel Aufwand die die Suche nach defekten Weblinks. Zur Unterstützung der manuellen Arbeit wäre eine farbliche Unterlegung der „archiv.is/shrtlnk“-URLs für mich sehr hilfreich, da sich mein Workflow hier kaum von dem des Fixen toter Links unterscheiden dürfte. (Da habe ich mich nach inzwischen rund 10000 gefixten Links nur mit diesem Tool schon gut daran gewöhnt) Frohes Schaffen — Boshomi ☕⌨☺ 11:59, 21. Apr. 2014 (CEST)
<bk>vor bk:
- Eine mögliche Vorlage könnte zur Unterstützung meiner Arbeit könnte so aussehen:
{{WLWisToday | shortlink=aef2cd6 | originalURL=http=www.example.org/archivurl.test | wayback1=20010203040506 | wayback2=20140401235959 | atoday=20010203040506 | pageid=1234}
, wobei die einzelnen Parameter ausgenommen der originalurl nur befüllt werden, wenn ich einem 200er – http-Status zurückbekomme. pageid ist die jeweilige wikipedia-Seitenkennnummer. - Fürs erste wäre es schon eine Hilfe wenn die archive.is Links in der weblinkChecker-Tabelle mit einer hässlichen Farbe hinterlegt werden, damit diese Links schnell auffindbar werden. (archiv-today sollen grau bleiben)
- Eine mögliche Vorlage könnte zur Unterstützung meiner Arbeit könnte so aussehen:
- Mein geplanter Entscheidungsbaum:
- # Archiv.is/shrtlnk öffnen und nach Live-Link im Web suchen falls vorhanden Live-Link eintragen =>fertig
- # Webarchive.org Links öffnen, Mementum ist diese brauchbar => Webarchiv.org Link eintragen =>fertig
- # Archive.today-Langlink ist brauchbar =>fertig
- # Nach Ersatzlink, der die Fakten belegt finden =>fertig
- # {{Toter Link}} mit Originalurl eintragen => fertig
- Für die allermeisten Fälle erwarte ich eine Lösung nach Punkt 2 oder 3. Wenn in einem zweiten Schritt die Daten aus der Vorlage direkt in der weblinkChecker-Tabelle zur Verfügung stünden, wäre das natürlich auch recht nützlich. (In einem dritten Schritt könnte man sich überlegen, wie man allgemein kaputte mit Bots nicht reparierbare Domains mit skriptgesuchten Trefferlisten für manuelle Reparatur aufbereitet) Frohes Schaffen — Boshomi ☕⌨☺ 01:18, 26. Apr. 2014 (CEST)
<nach bk> @CennoxX: Danke für die Info. Das Umstellen auf Langlinks, und das Verpacken der Links in Vorlagen halte ich jedenfalls für sinnvoll und notwendig. Viele der URLs wurden ungeprüft eingesetzt, sodass eine Sichtung nicht schaden kann. Siehe dazu auch Wikipedia:WVW#Archivparameter in {{Internetquelle}}, {{Cite web}}, {{Cite news}} & Co. Vielleicht lautet die Domain ja morgen schon auf archive.irgendwas. Wie stabil das ist lässt sich kaum abschätzen, und alles menschliche ist endlich. Frohes Schaffen — Boshomi ☕⌨☺ 01:18, 26. Apr. 2014 (CEST)
- Ich habe 1994 vom 2661 automatisch recherchierten Links auf https://de.wikipedia.org/w/index.php?title=Benutzer:Boshomi/Test&action=edit gestellt; Bei der Restmenge habe ich wegen ungenügender Header noch Probleme Sinnvolles zu finden. Die Liste im Link taugt aber gerade mal um sich ein wenig Überblick zu schaffen. Vermutlich sind mehr Live-Links als ich ursprünglich erwartet hatte zu finden. Frohes Schaffen — Boshomi ☕⌨☺ 20:33, 27. Apr. 2014 (CEST)
manche URLs werden nicht erkannt
Siehe: „24 (Fernsehserie)“ oldid=129995919; in diesem Fall werden nur 2 von 4 archive.is urls erkannt. Frohes Schaffen — Boshomi ☕⌨☺ 19:04, 1. Mai 2014 (CEST)
Im Artikel Edward Snowden sind derzeit 71 Links nicht erkannt. Die Ursache scheint sehr rätselhaft, denn auf fast allen anderen Seiten funktioniert die Erkennung einwandfrei. Frohes Schaffen — Boshomi ☕⌨☺ 20:45, 5. Mai 2014 (CEST)
- Die Ursache ist an sich simpel. Ich habe die Begrenzung erst einmal wieder raus genommen, wenn sie so zu viel Verwirrung stiftet. --TMg 21:17, 15. Jun. 2014 (CEST)
Einige Anmerkungen nach einer Menge Edits
Mal Danke! für all die Arbeit die du hier reinsteckst.
Ich habe nun die ursprünglich 2600 Links auf archive.is vollständig durchkorrigiert. Dabei hat sich die Zahl der Links auf die Nachfolgedomain um Faktoren reduziert. Von den letzten rund 1100 Links sind nur etwa 200 archive.today Links übrig geblieben. (Anm: 15. Juni: Heute sind es noch 2170 Links auf Archive.today, Ende April waren es rund 4300 auf die beiden Domains, dabei habe ich die Langlinks noch gar nicht angesehen)
Einige Anmerkungen:
- m-breite Leerzeichen sind praktisch überall wo ich sie angetroffen habe korrekt gesetzt. Das automatische Ausbessern musste daher per Hand rückgängig gemacht werden. Diese Zeichen werden vor allem bei asiatischen Schriften benötigt. Ich würde empfehlen die Zeichen m- und n-breite Leerzeichen durch die entsprechenden html-Entities zu ersetzen.
- Das direkte öffnen der .today -Links ist eine gute Idee, und sollte auch für Webarchive ausgebaut werden: Überall dort wo auf ein konkretes Memento verlinkt ist, sollte der Link das Memento des Quelltextes anzeigen (vor allem wenn die Vorlage Webarchive verwendet wurde), nur dort wo noch kein Archivlink verwendet wird, sollte der /*/-Suchlink geöffnet werden (so wie bisher)
- archive.is kommt nicht mehr vor, daher kann der entsprechende Code-Abschnitt anders verwenden. Ich denke dass die Umstellung von archive.today-Kurzlinks zu den entsprechenden Langlinks zu einer Daueraufgabe wird. Es wäre durchaus nützlich archive.today links die nicht dem Muster "archive.today/\d{14}/" entsprechen rot zu markieren. Ich bin gerade dabei die technische Grundlage für eine dauerhaft gewartete Arbeitsliste zur Überprüfung entsprechender Links zu schaffen.
Frohes Schaffen — Boshomi ☕⌨☺ 22:34, 12. Jun. 2014 (CEST)
- Ich verstehe leider nicht, was du mit „m-breiten Leerzeichen“ meinst. Kannst du bitte ein oder zwei Beispiel-Artikel nennen, in dem du das oder die betreffenden Zeichen gesehen hast?
- Was ist ein „Memento“?
- Ich habe einen Sonderfall drin, der die WebCite-Suche ausblendet, wenn ein archive.is-Link vorliegt. Die archive.org-Suche wird immer angezeigt, insofern ergibt ein weiterer Sonderfall dafür keinen Sinn. Ich könnte höchstens WebCite und archive.is so tauschen, dass letzteres zum Standard wird.
- Die Markierung von archive.is-Kurzlinks ist doch schon drin, oder hab ich da was übersehen?
- --TMg 21:33, 15. Jun. 2014 (CEST)
- Gemeint ist mit M-Breites Leerzeichen (das Zeichen
 
) Es handelt sich dabei um das korrekte Leerzeichen zwischen 2 Wörtern/Teilsätzen Ostasiatischer Schriften (z.B. Japanisch, Chinesisch, Koreanisch),Das n-Breite Leerzeichen ( 
) kommt seltener vor, hat aber auch bestimmte nützliche Einsatzzwecke, und wird praktisch nur von erfahrenen Benutzern eingesetzt, bzw. kommt hier per C&P aus Originaltexten hierher. Am besten sucht man gleich in einem Artikel der entsprechenden Sprache [5] Der Hintergrund ist, dass die Schriftzeichen dieser Sprachen damit alle gleich breit dargestellt werden, und damit ein typographisch schöneres Bild entsteht. Dafür gibt es auch den Unicode Block: "Halfwidth and Fullwidth Forms".- <einschub>Yuki_Nagato, Gouverneurswahlen_in_Japan_2012 Beispiele für korrekte m-Breite-Leerzeichen im Wikitext. Frohes Schaffen — Boshomi ☕⌨☺ 20:44, 21. Jun. 2014 (CEST)
- Memento ist eine Version einer Seite in einem Webarchiv, bei Wayback.archive.org ein Link mit einem Zeitstempel.
- Bei der direkten Verlinkungen habe ich mich vielleicht schlecht ausgedrückt: Will man derzeit das Memento einer mit der Vorlage {{Webarchiv}} eingelagerten Seite ansehen muss man zumindest auf die Artikelvorschau gehen, um den Link zu erhalten. Zur Lösung dieses Problems schlage ich daher vor:
- ist keine Archivversion zur Url angegeben, bleibt alles wie bisher.
- wird eine Archivversion erkannt (z.B. Vorlage Webarchiv) führt der Link nicht zur allgemeinen Suche (/*/ bei arichve.org) sondern zum konkret angegebenen Memento.
- Archiv.is kommt im ANR nicht mehr vor. Allerdings fürchte ich seit heute, dass ich auch diese Domain weiter beobachten muss, denn alleine in enwiki kommt das 19500 mal im ANR vor, davon 14000 Kurzlinks! (im Vergleich zu nur 8800 Links auf archive.org (sic!) im enwiki, da habe ich alleine mit diesem Tool schon mehr Links auf web.archive.org in dewiki gesetzt als im gesamten enwiki vorkommen.) Wir haben in dewiki im Übrigen auch keine Kurzlinks mehr im ANR. Wegen dieser neuen Fakten vermute ich, dass mit Imports immer wieder solche Links auftauchen, und daher an deiner Codebasis in diesem Punkt nichts verändert werden braucht. Frohes Schaffen — Boshomi ☕⌨☺ 03:02, 17. Jun. 2014 (CEST)
- Groschen gefallen, Leerzeichenproblem gelöst. Auch das mit dem Wayback-Link habe ich jetzt verstanden und erledigt. Danke für die Geduld. --TMg 00:15, 27. Jun. 2014 (CEST)
- Danke, das funktioniert gut. Nur bie Chromium (Version 36.0.1985.67 (276210) ) gibt es nun ein Problem, dass der nach dem Klick "↓" zwar markiert wird, aber der Fokus im Bearbeitungsfenster unverändert bleibt. (Chrome Version 35.0.1916.153 und Firefox funktionieren normal, das heißt der markierte Link befindet sich im sichtbaren Bereich des Bearbeitungs-Widgets) Eventuell ist das auch ein neuer Bug in Chromium-Beta Frohes Schaffen — Boshomi ☕⌨☺ 22:38, 27. Jun. 2014 (CEST)
- Gemeint ist mit M-Breites Leerzeichen (das Zeichen
Vorlagen Waybackarchiv und WBA sind nun vollständig entbunden, WBA ist gelöscht, Waybackarchiv wird es wohl demnächst.
Die Vorlage Waybackarchiv werde ich mir vermutlich in meinen BNR verschieben, und damit eine kalte Löschung vornehmen. Diskussion ist vermutlich sowieso nicht notwendig. Damit kann der Codeabschnitt im JavaScript entfernt werden, womit die zukünfitge Wartung erleichter wird. Frohes Schaffen — Boshomi ☕⌨☺ 17:46, 28. Jun. 2014 (CEST)
- Waybackarchiv ist inzwischen auch gelöscht. (dafür waren heute mehr als 1000 Edits notwendig) Frohes Schaffen — Boshomi ☕⌨☺ 18:21, 28. Jun. 2014 (CEST)
Verdoppelung der Linktexte
siehe [6]: in diesem Fall wir der Linktext zwar in den Link übernommen, der alte Text bleibt aber stehen, und muss per Hand entfernt werden. Frohes Schaffen — Boshomi ☕⌨☺ 20:03, 2. Jul. 2014 (CEST)
- Das Problem tritt auch auf, wenn eine Vorlage Webarchiv eingesetzt wird wie etwa hier Exil in der Türkei 1933–1945 Frohes Schaffen — Boshomi ☕⌨☺ 20:13, 2. Jul. 2014 (CEST)
Vorschlag zur Umsetzung benutzerdefinierter URL-Ersetzungen.
Siehe Wikipedia_Diskussion:WikiProjekt_Weblinkwartung/Archiv#1000_Ruderdatenbank-Links_kaputt und Wikipedia:WikiProjekt_Weblinkwartung/Domains_im_Fokus/www.seds.org;
Besonders zweiteres läuft derzeit in der Regel per Botauftrag, und da kann man gelegentlich lange warten (siehe INSEE-Links auf WP:BA liegt inzwischen fast 11 Monate)
Da du mit deinem Skript ganz gut auf das API zugreifen kannst, denke ich, dass eine API-basierte Lösung recht effizient sein könnte. Ich denke da an eine Lösung wie sie derzeit bei {{Toter Link}} eingesetzt wird: das Schalten von Hilfslinks, die über die el-API abfragbar sind.
http://wlc.invalid/id0001/old/http://www.example.org/badlinkA http://wlc.invalid/id0001/new/http://www.example.org/goodlinkA
http://wlc.invalid/id0002/old/http://www.example.org/badlinkB http://wlc.invalid/id0002/new/http://www.example.org/goodlinkB
...
http://wlc.invalid/idNNNN/old/http://www.example.org/badlinkNNNN http://wlc.invalid/idNNNN/new/http://www.example.org/goodlinkNNNN
Im Fall von seds.org könnte man das einfach in die Wartungsliste per Replace einfügen. Danach könnte der weblinkChecker die Änderung gleich vorschlagen (new wird ins Editierfeld eingetragen) und per "Änderungen übernehmen" in den Artikel eingesetzt. Inkulusive Diff Ansehen dauert so ein Edit kaum 10 sek, womit auch rießige Wartungslisten mit akzeptablen Aufwand machbar wären. Der Vorteil wäre, dass nur exakte Deeplinks, die man idealerweise zuvor geprüft hat (siehe seds.org), ersetzt würden. Frohes Schaffen — Boshomi ☕⌨☺ 20:38, 12. Okt. 2014 (CEST)
archive.today mal wieder
archive.today ist offensichtlich nach https://archive.is umgezogen. Das https-Protokoll scheint dieses mal im Gegensatz zu archive.today zu funktionieren. Frohes Schaffen — Boshomi ☕⌨☺ 17:59, 25. Apr. 2015 (CEST)
unterstützte Vorlagen
Bitte den Ausdruck var isCite = de || /^(?:Internetquelle|Cite (?:web|news)) um "journal" und "book" ergänzen. Bei Cite book wird zwar das accessdate nicht angezeigt, ein Eintrag schadet aber nicht. Frohes Schaffen — Boshomi ☕⌨☺ 17:59, 25. Apr. 2015 (CEST)
Fehler bei nummerierten Parametern oder Klammern hinter der URL
Siehe diff spezial:diff/142824325
Ich vermute dass der Fehler dann vorkommt, wenn nummerierte Paramter verwendet werden, was relativ selten vorkommt, aber im konkreten Fall zumindest erklärbar ist ("=" in der ULR). Interessanter Weise wird dadurch auch der Linktext gelöscht. (btw. bitte auch mal die Vorlagen Cite journal und Cite book zu den unterstützten vorlagen aufnehmen. Frohes Schaffen — Boshomi ☕⌨☺ 22:36, 5. Jun. 2015 (CEST)
Vorlage Tagesschau.de Parameter AlteURL
Das Problem mit der eigentlich zu löschenden Vorlage {{Tagesschau.de}} (siehe Wikipedia:Löschkandidaten/4._April_2013#Vorlage:Tagesschau.de (gelöscht)) steht derzeit auf meinem Radar. Ich habe dazu 3 Wartungslisten (Wikipedia:WikiProjekt Weblinkwartung/Toter Link/Liste Vorlage Tagesschau 1, Wikipedia:WikiProjekt Weblinkwartung/Toter Link/Liste Vorlage Tagesschau 2, Wikipedia:WikiProjekt Weblinkwartung/Toter Link/Liste Vorlage Tagesschau 3)
Als Lösungsweg sehe ich hier zwei Haupt-Varianten: 1. URL wurde in einem Webarchiv gesichert => Ersetzen mit der Vorlage Webarchiv 2. Der Fakt lässt sich auch durch ein anderes Medium belegen: Kompletter Ersatz der Referenz. (es gibt auch Webseiten wie http://tsarchive.wordpress.com)
fast 2000 Links zu ersetzen ist eine Menge Arbeit. Wäre schön, wenn du das Skript so anpasst, dass das Ersetzen besser unterstützt wird. Frohes Schaffen — Boshomi ☕⌨☺ 22:36, 5. Jun. 2015 (CEST)
- Ich hab hier schon eine ganze Weile nicht mehr geantwortet. Wikizeit ist rar geworden. Ich werde mich bemühen, zumindest die oben gemeldeten Fehler zu beheben. Unterstützung für spezielle Vorlagen wie diese hier liegen aber leider außerhalb meines Zeitbudgets. --TMg 13:29, 7. Jun. 2015 (CEST)
- Ist ok. Da wird mir schon was einfallen. Vielleicht kann ich ja die Vorlage so umbauen, dass ich sie gut substen kann. Danke für das Fixen der obigen Punkte. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 14:53, 7. Jun. 2015 (CEST)
Etwas Magic für Webcitation
Aus der Webcite-ID lässt sich das Archivierungsdatum berechen. Diese Funktion berechnet ein Datum im Iso-Format: (sollte es zumindest ;-))
var webcitedate = function(str,ret,counter,codepoint,retdate){
if (/^[A-z0-9]{9}$/.test(str)){ //Angabe als 9-stelliger Base62 code
for(ret=counter=(str===(str+="")&&/^[A-z0-9]+$/.test(str))-1;
codepoint=str.charCodeAt(counter++);
)
ret=ret*62+codepoint-[,48,55,61][codepoint>>5];// 2**5=32; 0=48 A=65-10=>55 a=97-10-26=61
}
if (/^[0-9]{16}$/.test(str)) {//Angabe als Unix-timestamp als 16-stelliger Integer in microsec genau)
ret=str;}
var retd = new Date(ret/1000);
retdate =retd.getFullYear()+'-'+('0'+retd.getMonth()).slice(-2)+'-'+('0'+retd.getDate()).slice(-2) // .toLocaleFormat('%Y-%m-%d') funktioniet leider nur im FF;
// vielleicht gibt es dafür auch eine bessere Variante.
if (/(&|\?)date=\d{4}-\d{2}-\d{2}/.test(str)) {//Falls die Original-URL und das Datum schon in der URL enthalten ist
m= /(&|\?)date=(\d{4}-\d{2}-\d{2})/.exec(str)
retdate=m[2];
};
return retdate};
//test <b id="ret"></b> <b id=str></b>
//var str="query?date=2009-10-26+00:14:31&url=http://www.geocities.com/hualian_studentclub/pilihanraya/pilihanraya_umum_sabah_1981.htm"//,
//var str="query?url=http://www.geocities.com/hualian_studentclub/pilihanraya/pilihanraya_umum_sabah_1981.htm&date=2009-10-26+00:14:31"//,
//var="1244701585607193"
//var="5hRfVFhaT"
//document.getElementById("ret").innerHTML = webcitedate(str)
//document.getElementById("str").innerHTML = str
Vielleicht kannst du das mal anschauen und passend einbauen. Für Leute die nicht erahnen, dass das Datum schon in der ID steckt, wirkt diese Funktion ein wenig wie Zauberei. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 22:09, 3. Jul. 2015 (CEST)
- hallo TMg: Der Botlauf 2015 steht kurz bevor (Siehe Disk Benutzerin:Giftpflanze. Zuvor möchte ich noch gerne gut 1500 Seiten mit Webcitations Verwendungen kontrollieren, und ev. Vorlagen einsetzen. Da wäre es eine riesen erleichterung wenn du den die Umrechnung von base62 Umrechung umsetzen könntest.
- Fürs erste würde es vollkommen reichen wenn das nur für die IDs umgesetzt würde die dem Muster /\w{9}/ entsprechen: Die Formel zur Umrechnung in einen Unix Timestamp lautet:
var base62webcite =function(a,b,c,d){for(b=c=0;d=a.charCodeAt(c++);b=b*62+d-[,48,55,61][d>>5]);b=b/1000;return b};
Wäre toll, wenn dann die archivedate/archiv-datum-Parameter korrekt vorbefüllt würden! Die anderen Variante kommen so selten vor, dass sie für dieses Benutzerskript irrelevant sind, und die paar Fälle kann ich leicht auf die /\w{9}/-Variante der ID umstellen. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 00:53, 22. Okt. 2015 (CEST)
Fehler bei Kommentaren, die von Bots gesetzt wurden => Erkennung von gt und lt innerhalb von Vorlagen
siehe [7]. Dort wurden von einem Bot Autoren ergänzt, mit der Folge, dass das Skript die Vorlage Cite web nicht mehr erkennt. Der gleiche Fehler tritt auch auf wenn Tags wie <sup>bla</sup> im Titeltext vorkommen. (Das ist ein Fehler den ich nicht ausbessern könnte, da dieser Teil des Skripts schon sehr anspruchsvoll ist.) Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 18:57, 26. Okt. 2015 (CET)
- siehe Deutsche_Dreiband-Meisterschaft_2011/12, 2 und 3. auf dieser Seite friert das Skript bei Chrome ein, mit FF komme ich wenigstens auf eine Fehlermeldung die auf die Zeile 421 verweist. (zuvor hatte ich rund 160 Edits ohne Probleme)
- in beiden Fällen bleibt das Skript an der Stelle b = /^(?:[^<]|<!--[^>]*-->|<(?!\w)|<(abbr|[biq]|bd[io]|em|nowiki|small|strong|su[bp])\b[^<>]*>[^<>]*<\/\1\s*>)*<\/ref\s*>/i.exec( t.slice( parsedEnd ) ); stecken. Bei anderen Dreiband-Aritikeln scheint es keine Probleme zu geben. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 20:17, 28. Okt. 2015 (CET)
- Ich bin jetzt mit der sehr langen Liste mit den Bearbeitungen durch. nach "D" trat der Fehler nicht mehr auf. nur bei zwei Artikel : (Nekrolog 1. Quartal 2012 und Nekrolog 3. Quartal 2013) schien es auch so ein Fehler zu sein, aber das war nur eine sehr lange Berechnungszeit. Beim Abspeichern musste ich einige Male auf "warten" klicken. Das Problem ist wahrscheinlich auf die Tabellensyntax beschränkt. Bei den Dreiband Artikeln könnte es auch sein, dass man mit oftmaligen Bestätigen von "Warten" durchkommt, aber ich habe das nach längerer Zeit aufgegeben. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 14:32, 31. Okt. 2015 (CET)
- Ich habe den regulären Ausdruck mal etwas entschärft und hoffe, dass dadurch keine Funktionalität beeinträchtigt wurde. --TMg 10:45, 27. Nov. 2015 (CET)
- Ich bin jetzt mit der sehr langen Liste mit den Bearbeitungen durch. nach "D" trat der Fehler nicht mehr auf. nur bei zwei Artikel : (Nekrolog 1. Quartal 2012 und Nekrolog 3. Quartal 2013) schien es auch so ein Fehler zu sein, aber das war nur eine sehr lange Berechnungszeit. Beim Abspeichern musste ich einige Male auf "warten" klicken. Das Problem ist wahrscheinlich auf die Tabellensyntax beschränkt. Bei den Dreiband Artikeln könnte es auch sein, dass man mit oftmaligen Bestätigen von "Warten" durchkommt, aber ich habe das nach längerer Zeit aufgegeben. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 14:32, 31. Okt. 2015 (CET)
Zugriffsdatum in Vorlagen aktualisieren
Hallo TMg, ist eine Erweiterung möglich, mithilfe dessen der Zugriff in den Vorlagen Internetquelle und cite web aktualisiert wird, sobald ein neuer Link eingefügt wird? --Der Buckesfelder Disk. bewerten E-Mail 11:50, 7. Dez. 2015 (CET)
- Möglich ja, aber nicht leicht umsetzbar. Ich kann noch nicht versprechen, wann ich dafür Zeit haben werde. --TMg 12:46, 7. Dez. 2015 (CET)
- zur Anfrage wegen des Zugriffsdatums, da hatte ich inzwischen ein wenig Zeit zum nachdenken: Wenn eine alte URL gegen eine neu URL ausgetauscht wird, wäre das schon eine tolle Funktion.
- Eine Ausnahme sehe ich bei Webarchiven. Da ist es wahrscheinlich klüger, das alte Zugriffsdatum unverändert stehen zu lassen. Wenn ich zusätzlich im Artikel Änderungen vornehme, setze ich meist das Zugriffsdatum gleich dem archiv-datum. Wenn sich das Zugriffsdatum vom archiv-datum Unterscheidet, muss man jedenfalls im Fall eines späteren Archivdatums als Zugriffsdatum davon ausgehen, dass sich der Inhalt des Belegs möglicherweise geändert hat. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 23:30, 7. Dez. 2015 (CET)
Vorlage:BBKL
Ich habe gestern in meinem Fork die Vorlage BBKL zu den unterstützten Vorlagen hinzugeben, da dort nach einer Umstellung bei 7000 Einbindungen der Parameter archiveurl vorkommt. Das Problem war, dass zuvor die Vorlage Webarchiv in BBKL eingesetzt wurde. Ich wollte das eigentlich erst melden, wenn ich das für mich ausreichend getestet habe, aber wenn du schon beim Anpassen bist, kann das vielleicht gleich mitgemacht werden. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 13:04, 7. Dez. 2015 (CET)
Zur Vorlage BBKL die Anpassung so wie ich sie vorgenommen habe, funktioniert, nachdem ich der Vorlage BBKL noch den Parameter archiveurl
verpasst habe. Ich hielt die Anpassung der Vorlage an {{Cite Web}} besser als zusätzliche Ausnahmen. Der Parameter url in der Vorlage stört nicht weiter. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 00:05, 10. Dez. 2015 (CET)
.today ist endgültig tot
Siehe Spezial:diff/151706695 und Domain problems again. Ich hätte auch das Protokoll auf https umgestellt, habe aber die Codezeile dafür noch nicht gefunden. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 13:27, 20. Feb. 2016 (CET)
- Hier bei mir ist da meines Wissens nichts weiter zu tun. Erkennen kann das Skript beides. Ausgeben tut es Links dorthin niemals, sondern nur als Vorlagenparameter. Die umzustellen, muss in den jeweiligen Vorlagen geschehen. Sollte ich dabei etwas übersehen haben, weise mich bitte darauf hin. --TMg 15:50, 21. Feb. 2016 (CET)
- Das Erkennen von Archive.is funktionierte sowieso immer einwandfrei. Die Codezeile, die ich nicht gefunden habe ist, dass es an manchen Stellen wo im Archiv-url Parameter ein http://archive.is vorkommt, und ich eigentlich möchte, dass analog zu web.archive.org automatisch nach https:// ausgebessert wird. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 16:30, 21. Feb. 2016 (CET)
- p.s: Der Vorteil der Vereinheitlichung des Schemas und der Domain hat übrigens sehr nette Nebeneffekte: siehe etwa dieses mächtige SQL: quarry 7499 (Entweder ist die Original-URL tot, dann gehört ein Archiv, andernfalls sollte der Archivlink durch den Originallink ersetzt werden). Wir haben übrigens eine praktisch 100% Abdeckung von Archiv-URLs durch Vorlagen erreicht. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 16:30, 21. Feb. 2016 (CET)
feature Request
Nachdem ich das LUA-Modul Modul:Vorlage:Defekter_Weblink geändert habe sind die von Giftbot gefundenen URLs über die API mit dem Präfix http://giftbot.dwl.invalid/ erreichbar. Damit sollte es möglich sein, diese URLs in der Tabelle z.B. blau einzufärben. Beispiel special:LinkSearch/http://giftbot.dwl.invalid/http://100.empas.com/dicsearch/pentry.html?s=&i=289276.
Aufgrund so manchen Bugs wie etwa T126913 wird das zwar nicht alles finden, aber wäre trotzdem eine große Hilfe. Für das Aufräumen der Diskseiten versuche ich derzeit schrittweise Abfragen zu entwickeln, die per Bot ausgeführt werden können (Basisabfrage und hier die erste bottaugliche quarry:query/7755), sodass die Einfärbungen mittelfristig recht aktuell passen sollten. Frohes Schaffen — Boshomi ☕⌨☺ Defekte URLs - Hilfe gesucht 12:39, 2. Mär. 2016 (CET)
Kleinigkeit
Damit das Skript nicht in Kategorie:Wikipedia:Vorlagenfehler/Vorlage:Webarchiv/Parameterfehler habe ich meinem Fork ein nowiki-pärchen eingebaut. siehe etwa Zeile 280 in Benutzer:Boshomi/externalURLform.js Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 23:06, 6. Feb. 2017 (CET)
- Danke für den Hinweis. Diese Lösung ist etwas sauberer. --TMg 15:42, 8. Feb. 2017 (CET)
Neue Version meines Forks des weblinkCheckers
Hallo Thiemo!
siehe dir mal Benutzer:ExURLBot/externalURLform.js (meine stabilere Version) bzw. Benutzer:Boshomi/externalURLform.js(derzeit gleich, aber es kann sich schneller ändern, da meine Eating-your- own-dog-food-Version.)
Neu ist unter anderem die Untersützung für zusätzliche Länder-TLD für archive.is sowie Untersützung für InternetArchiveBot-Meldungen.
Anmerkung: Aus Zeitmangel war ich längere Zeit kaum aktiv. Offensichtlich hat sich in der Zeit so einiges verändert. Autoformater funktioniert bei mir derzeit nicht wie gewünscht (die Änderungen werden anscheinend durchgeführt, aber am Ende doch nicht in den Quelltext zurückgegeben. Da melde ich mich wenn ich mehr weiß.) Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 22:31, 29. Aug. 2019 (CEST)
Anmerkungen:
- Ich würde, wenn die Bot-Meldungen durch dein Script unterstützt wir, einen neune Unterabschnitt "Benutzerscripte" dort einfügen: Benutzer:InternetArchiveBot/Anleitung/Archivlink#Markierung entfernen.
- Derzeit benötigt das Skript soweit ich sehe das Diff des Autoformaters. Es wäre schön, wenn man das gleich direkt hier integrieren könnte. Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 22:53, 29. Aug. 2019 (CEST)
- Einen Bug habe ich jetzt auch noch gefunden:
Im Artikel St. Albani (Göttingen) hat ein Benutzer
{{Webarchiv|url=http://www.zi.fotothek.org/obj/obj19004499/Galerie|archive-is=2005-04-05|text=Sicherheitsverfilmung des Flügelaltars 1943–1945}}
eingetragen.
- Der resultierende URL funktioniert zwar, und wird mit meiner neuen Version rot Markiert (das war eigentlich für yyyy-mm-tt.ssssss gedacht, die auch nach \d{14} normalisiert werden sollen.
- Der Link unter ".is" liefert https://archive.is/2005-04-05 statt https://archive.is/20050405/http://www.zi.fotothek.org/obj/obj19004499/Galerie
Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 23:07, 29. Aug. 2019 (CEST)
- in meinem Fork habe ich das gefixt indem ich aus \w? ein \W? gemacht habe. Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 09:57, 30. Aug. 2019 (CEST)bemerkt
@Boshomi, ich habe deinen Diskussionsbeitrag hier gesehen. Kannst du mir sagen. welche Änderungen besonders dringend sind, um mein Skript wieder auf den aktuellen Stand zu bringen? (To do für mich: User:ExURLBot/externalURLform.js und ggf. auch User:ⵓ/externalURLform.js prüfen und allgemeingültige Änderungen übernehmen.) --TMg 16:53, 6. Apr. 2020 (CEST)
- TMg,Thiemo Kreuz (WMDE): Sorry, ich habe das erst heute gesehen. Ich schaue da im Lauf der Woche rein, heute spielt mein Kopf nicht mehr mit, da ich schon seit 3:00 an der Arbeit bin... (nicht signierter Beitrag von ⵓ (Diskussion | Beiträge) 18:06, 11. Mai 2020 (CEST))
Neuer Quelltext Modus
Cool wäre es, wenn am Skripte wie Autoformater und dieses hier, als AddOn zum Beat-Feature "Neuer Quelltext Modus" integrieren könnte. Das verwenden anscheinend schon sehr viele Benutzer. Frohes Schaffen — Boshomi ⌨ Defekte URLs - Hilfe mit! 23:17, 29. Aug. 2019 (CEST)