Wikiup Diskussion:WikiProjekt Weblinkwartung/Archiv/2018
Adolf Köberle
In diesem Artikel weigert sich die in Referenz 5 stehende URL www.e-periodica.ch/... durch eckige Klammern ausführbar zu werden. --Gerbil (Diskussion) 22:07, 16. Mai 2018 (CEST)
- gefixt.--Mabschaaf 22:21, 16. Mai 2018 (CEST)
- Danke. Da hätte ich auch allein drauf kommen müssen... --Gerbil (Diskussion) 08:49, 17. Mai 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Gerbil (Diskussion) 08:49, 17. Mai 2018 (CEST)
Umgang mit toten Links
Ich möchte auf der Seite Anna Vita die toten Links zu Zeitungsartikeln regenerieren. Unter archive.org habe ich nichts gefunden. Wenn ich nochmal (kostenpflichtigen) Zugriff auf Zeitungsartikel im Netz bekomme - kann ich sie irgendwo speichern/spiegeln? Und was wäre mit analogen Kopien von Zeitungsartikeln? Sind die lizenzpflichtig oder sind sie Allgemeingut und können irgendwo abgelegt werden? Kennt Ihr andere Möglichkeiten? Bin neu bei dem Thema. --LGvProtesus (Diskussion) 14:52, 12. Dez. 2018 (CET)
- @Protesus: Lómelinde hat das schon mal erledigt. Aber zu Deinen Fragen noch soviel: Es reicht die Angabe schon aus, wo der Artikel gedruckt ist, Du musst weder Lizenzen kaufen, diese speichern oder spiegeln. Wenn Du einen kostenpflichtigen Zugriff auf Zeitungsartikel erworben ist, darfst Du diese Artikel auch nur für Dich und Deinen weiteren Recherchen verwenden. Du darfst sie nicht weiter verbreiten, für andere Benutzer lesbar einscannen und ins Netz stellen und auch nicht spiegeln, denn alles das verstößt gegen das Urheberrechtsgesetz. Der kostenpflichtige Zugriff erlaubt nur, dass Du den Artikel voll lesen kannst, Du kaufst damit aber keine urheberrechtlichen Lizenzen oder Kopierrechte. Wie gesagt, es reicht aus, den verwendeten Zeitungsartikel im Artikel anzugeben, wenn er nicht im Netz lesbar verlinkt zu finden ist, muss sich der Leser selbst darum kümmern, wenn er diese Quelle einsehen möchte. Liebe Grüße, – Doc Taxon • Disk. • Wikiliebe?! • 00:22, 13. Dez. 2018 (CET)
- @Doc Taxon: Besten Dank für die Hilfe! --(nicht signierter Beitrag von Protesus (Diskussion | Beiträge) 10:46, 14. Dez. 2018 (CET))
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 11:56, 29. Dez. 2018 (CET)
Maßnahmen, wenn Link auf Viren/Phishing/Betrug-Seiten zeigt
In der Hoffnung von hier eine Antwort zu bekommen verlinke ich die alte Diskussion und würde mich über Ratschläge freuen. --Anton Sachs (Diskussion) 14:16, 22. Apr. 2018 (CEST)
- @Anton Sachs: Das ist dann ein klarer Fall für eine WP:SBL, Falls die originale Seite noch im Webarchiv auffindbar ist, kann statt dessen auch die Vorlage {{Webarchiv}} verwendet werden, da diese den alten Originallink nicht anzeigt. Die Vorlage Internetquelle würde bei Verwendung von archiv-url den Orignallink trotzdem anzeigen, was in solchen Fällen definitiv unerwünscht ist. Frohes Schaffen — Boshomi ⌨ 15:41, 22. Apr. 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Anton Sachs (Diskussion) 09:56, 27. Nov. 2019 (CET)
bstu.de
Ich weiß nicht genau, ob ich hier richtig bin: Ich bin auf eine Broschüre gestoßen, deren Weblink (pdf) sich geändert hat. Sie ist in ca. 700 WP-Artikeln verlinkt. Gibt es eie Möglichkeit, den Link automatisch zu korrigieren? Konkret handelt es sich um Wer war wer im Ministerium für Staatssicherheit?. der ungültige Link war http://www.bstu.bund.de/DE/Wissen/Publikationen/Publikationen/handbuch_wer-war-wer_gieseke.pdf?__blob=publicationFile --Rita2008 (Diskussion) 18:10, 8. Dez. 2018 (CET)
- Müsste mit WP:Bots/Anfragen gehen. --FriedhelmW (Diskussion) 18:13, 8. Dez. 2018 (CET)
- gudn tach!
- leider laesst sich das per bot kaum automatisieren. hier mal drei beispiele
- alt: http://www.bstu.bund.de/DE/Wissen/Publikationen/Publikationen/handbuch_wer-war-wer_gieseke.pdf?__blob=publicationFile
- neu: https://www.bstu.de/assets/bstu/de/Publikationen/HB_gieseke_wer-war-wer.pdf
-
- alt: http://www.bstu.bund.de/DE/Wissen/Publikationen/Publikationen/handbuch_HA-XXII_wunschik.pdf?__blob=publicationFile
- neu: https://www.bstu.de/assets/bstu/de/Publikationen/HB_wunschik_HA_XXII.pdf
-
- alt: http://www.bstu.bund.de/DE/Wissen/Publikationen/Publikationen/handbuch_HA-XVIII_haendcke.pdf?__blob=publicationFile
- neu: https://www.bstu.de/assets/bstu/de/Publikationen/mfs-hb_06_haendcke-hoppe-arndt_ha-xviii_volkswirtschaft_barrierefrei.pdf
- die ersten beiden deuten noch auf was automatisierbares hin, aber beim dritten beispiel hoert das dann auf. also ist da wohl handarbeit angesagt. ich hab das mal exemplarisch an einem artikel gemacht: siehe [1]. ich bin so vorgegangen, dass ich mit der internen suche von bstu.de jeweils die publikationen gesucht und gefunden habe. die suche ist gut.
- statt direkt der pdf-dateien habe ich allerdings die uebersichtsseite zum jeweiligen dokument verlinkt. dann kann jeder selbst entscheiden, ob er das pdf herunterladen, eine harte kopie kaufen oder nur das inhaltsverzeichnis anschauen moechte.
- als wartungslisten eignen sich zwei wiki-suchen:
- am schluss sollte die suche eigentlich keine treffer mehr ergeben, sondern es sollte alles unter bstu.de zu finden sein. -- seth 19:04, 29. Dez. 2018 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Dr Lol (Diskussion) 13:56, 8. Apr. 2021 (CEST)
Nutzung von derefer.unbubble.eu
Nachdem das Thema jetzt hier und hier diskutiert wird und möglicherweise doch strittiger ist als gedacht, rufe ich Benutzer:DaB., Benutzer:Mabschaaf, Benutzer:Gestumblindi und Benutzer:PerfektesChaos hier zur zentralen Diskussion zusammen.--Cirdan ± 21:30, 26. Mär. 2018 (CEST)
- Wie andernorts schon vorgeschlagen kann der Originallink mM auch völlig entfallen; als aktiver, unmaskierter Link sollte er keinesfalls weiterhin im ANR stehen.--Mabschaaf 21:34, 26. Mär. 2018 (CEST)
- Das hätte den Nachteil das man schwieriger prüfen kann, ob der originale Link nicht doch noch (oder wieder) ok ist. --DaB. (Diskussion) 21:40, 26. Mär. 2018 (CEST)
derefer.unbubble.eu
war eine Privat-Aktion von Boshomi, die ich immer scharf kritisiert hatte, und die im Unvermögen begründet lag, sich irgendeine andere Lösung für ein privates Tool auszudenken, die sich nicht im produktiven Artikelbestand breit machen würde. VG --PerfektesChaos 21:37, 26. Mär. 2018 (CEST)- (BK)Wir müssen nicht mehr über Schnee von gestern reden, die Frage ist doch: Wie können wir die Weblinksuche nutzbar halten, um zwischen nicht bearbeiteten toten Links/Domains und solchen, die nur noch in den Archivvorlagen hinter "Originallink" liegen und keiner Aufmerksamkeit mehr bedürfen, unterscheiden zu können?--Mabschaaf 21:43, 26. Mär. 2018 (CEST)
- Nimm einfach den Link aus dem Abschnitt obendrüber: Jetzt werden nicht mehr (wie damals) 191 Einträge mit toten Links angezeigt, sondern insgesamt 217. Darunter findet sich dann beispielsweise auch Joachim Wrana, aber dort ist längst ein Archivlink eingetragen. Damit ist die Weblinksuche für verbleibende Links auf tote Domains unbrauchbar geworden.--Mabschaaf 21:54, 26. Mär. 2018 (CEST)
- Naja, eigentlich macht die Suche nun genau das was sie soll: Sie zeigt alle Links auf eine Domain an. Manche davon mögen tot sein, aber es sind immer noch Links auf die Domain. Sollte es irgendwann nötig werden, alle Links auf eine Domain zu suchen (weil die Domain z.B. einem Virenverteiler in die Hände gefallen ist), so geht das nun.
- Ich kann aber auch mit dem Vorschlag leben, die defekten Links gar nicht mehr zu verlinken. Was aber definitiv nicht geht, eine dritte Stelle ( derefer.unbubble.eu) zwischenzuschalten. --DaB. (Diskussion) 22:02, 26. Mär. 2018 (CEST)
- Die defekten Links nicht zu verlinken halte ich für wenig hilfreich, bei der Abarbeitung der InternetArchiveBot-Meldungen zum Beispiel ist es sehr wichtig, dass man auch den Originallink einfach klicken kann. Wie schwierig ist es denn, so einen Referer zu bauen? Ich stelle mir das nicht so kompliziert vor, aber vermutlich gibt es irgendwelche edge cases, die es knifflig machen.
- Alternativ wäre natürlich die Frage, wie die Weblinksuche angepasst werden kann. Der InternetArchiveBot erkennt ja auch, ob ein Originallink innerhalb einer Vorlage mit Archivlink steht oder ob hinter dem Link schon {{Toter Link}} steht. Das müsste eine Weblinksuche doch auch können?--Cirdan ± 22:26, 26. Mär. 2018 (CEST)
- Weblinksuche anpassen müssten die Entwickler MediaWiki-weit machen, klingt nach wenigen Jahren bis zur Umsetzung.
- Eigener/alternativer Referrer: Kann ich nicht beantworten.
- Dritter Weg/Kompromiss: Vorlagen ohne IABot-Eintrag zeigen den Originallink nicht; nur von IABot ergänzte und noch zu prüfende Archivlinks zeigen auch den Originallink.--Mabschaaf 22:34, 26. Mär. 2018 (CEST)
- Beim dritten Weg müsste aber der Originallink ja trotzdem noch im Artikeltext vorhanden sein. Bei {{Webarchiv}} steht der Originallink ja sogar immer drin (Parameter url muss bei allen Varianten befüllt sein), der Archivlink wird erst von der Vorlage zusammengebaut. Worin besteht eigentlich genau das Problem? Dass die URL irgendwo im Artikelquelltext steht oder dass die URL zwischen eckigen Klammern auftaucht? Wie machen das denn die Kollegen zum Beispiel in der englischsprachigen Wikipedia?--Cirdan ± 22:37, 26. Mär. 2018 (CEST)
- Das Problem habe ich oben beschrieben: 21:54, 26. Mär. 2018.--Mabschaaf 22:40, 26. Mär. 2018 (CEST)
- Entschuldigung, schlecht formulierte Frage. Ich meinte, worin das Problem für die Weblinksuche besteht. Findet die Weblinksuche grundsätzlich alle URLs, egal wo sie im Artikeltext stehen – also auch bei {{Webarchiv|url=http://ichbinkaputt.de|wayback=2099090909}}, wo die URL per Definition sozusagen immer tot ist? Oder nur solche, die tatsächlich als Link im Artikeltext ausgeliefert werden?--Cirdan ± 22:46, 26. Mär. 2018 (CEST)
- Die Weblinksuche findet jeden klickbaren Link, egal, ob er so im Quelltext steht oder von irgendeiner Vorlage zusammengebaut/erzeugt wird.--Mabschaaf 22:58, 26. Mär. 2018 (CEST)
- Entschuldigung, schlecht formulierte Frage. Ich meinte, worin das Problem für die Weblinksuche besteht. Findet die Weblinksuche grundsätzlich alle URLs, egal wo sie im Artikeltext stehen – also auch bei {{Webarchiv|url=http://ichbinkaputt.de|wayback=2099090909}}, wo die URL per Definition sozusagen immer tot ist? Oder nur solche, die tatsächlich als Link im Artikeltext ausgeliefert werden?--Cirdan ± 22:46, 26. Mär. 2018 (CEST)
- Das Problem habe ich oben beschrieben: 21:54, 26. Mär. 2018.--Mabschaaf 22:40, 26. Mär. 2018 (CEST)
- In der englischen Wikipedia haben sehe ich seit einiger Zeit kaum noch Leute die sich abseits von Bots mit der Weblinkwartung befassen. Daher will dort auch niemand eine Meldung, die die Benutzer auffordert, hinter dem IABot hinterherzueditieren. Wenn man schon will, dass sich Leute manuell mit dem Fixen von Links beschäftigen, dann sollte man diesen auch brauchbare Werkzeuge lassen. Wir haben dafür die Weblinksuche, giftbotweblinksuche und Quarry. Müllt man diese Werkzeuge mit gefixten toten Links zu, werden sie unbrauchbar. Frohes Schaffen — Boshomi ⌨ 00:50, 27. Mär. 2018 (CEST)
- Beim dritten Weg müsste aber der Originallink ja trotzdem noch im Artikeltext vorhanden sein. Bei {{Webarchiv}} steht der Originallink ja sogar immer drin (Parameter url muss bei allen Varianten befüllt sein), der Archivlink wird erst von der Vorlage zusammengebaut. Worin besteht eigentlich genau das Problem? Dass die URL irgendwo im Artikelquelltext steht oder dass die URL zwischen eckigen Klammern auftaucht? Wie machen das denn die Kollegen zum Beispiel in der englischsprachigen Wikipedia?--Cirdan ± 22:37, 26. Mär. 2018 (CEST)
- Danke an Mabschaaf und Cirdan
- @DaB.: Zuerst mal muss festgehalten werden, wo diese derefer.unbubble.eu URLs eingesetzt werden: Das sind Vorlagen die eine "Archiviert vom Original" Link anzeigen, wenn gleichzeitig ein Link auf ein Webarchiv angeboten wird. Es handelt sich also um tote ULRs die bereits gefixt sind. Ein Klick auf diese "Archiviert vom Original"-Links bringt nichts oder wie von Mabschaaf ausgeführt sogar Schaden, wenn die Domain von einem unseriösen Verwerter übernommen wurde. Da nur bereist gefixte URLs umgeleitet werden, ist das natürlich eine recht effiziente Hilfe für Leute die die Weblinksuche zum Fixen ganzer Domains einsetzen.
- Durch die Markierung der bereits gefixten Links sind auch Tools wie Quarry effizient einsetzbar: Beispiel quarry:query/7499: Mangels der Umleitung sind dort jetzt statt wenigen Tausend gleich derzeit 132280 URLs anzgezeigt. Das heißt, dass jetzt weit über 100000 URLs, die bereits gefixt sind, wieder aufscheinen, und wenn man nun überprüfen will, ob das schon gefixt ist, jede einzelne Seite aufrufen muss, um sich manuell zu überzeugen. Effizient ist das nicht. Kommt eine gleiche URL auf einer Seite mehrfach vor, und sind nicht alle gefixt, findet man das auf systematische Weise gar nicht mehr. (Das Fixen der übersehen Vorkommen war eine Aufgabe die ich früher sehr systematisch gemacht habe. Das war recht einfach und hoch effizient, da in der Regel schon ein manuell überprüfter Webarchivlink vorrätig war.).
- Wenn man nur den InternetArchiveBot hinterherarbeiten will, ist es praktisch unmöglich jemals damit fertig zu werden, denn man bekommt die gefixten Links nicht aus der Weblinksuche raus. Für Leute die systematisch große Domains warten, ist das eine Zumutung.
- Die derefer.unbubble.eu-Links waren und sind eine Lösung mangels besserer Alternativen. Ich habe sowieso auch ein Problem mit solchen Links, bei manchen Domains habe ich ausschließlich die Vorlage {{Webarchiv}} verwendet, die den "Archiviert vom Original". Die Vorlage {{Webarchiv}} ist alternativlos, wenn die ehemalige Domain von einen unseriösen Domainverwerter genutzt wird um unbedarfte Benutzer auf Seiten zu lotsen, die sie freiwillig nie aufrufen würden, manchmal waren da Zieldomains dabei, die bei uns prominent in der WP:SBL erwähnt sind. Muss eine Domain direkt in der SBL aufgenommen werden, ist die {{Internetquelle}} derzeit wegen des "Archiviert vom Original"-Links unbrauchbar.
- Meine bevorzugte Lösung wäre eine bei der der "Archiviert vom Original"-Link nicht mehr verlinkt wird, sondern dass sich beim Klick auf darauf der ehemalige Link als Text sichtbar wird. (zumindest für URLs, bei denen manuell überprüft ist, dass der Webarchivlink funktioniert und der tote Link wirklich tot ist.) Eine andere, durchaus überlegenswerte Variante wäre, den "Archiviert vom Original"-Link für manuell überprüfte URLs gar nicht mehr anzuzeigen. Frohes Schaffen — Boshomi ⌨ 00:38, 27. Mär. 2018 (CEST)
- @Boshomi: Erstmal willkommen zurück! {{Webarchiv}} zeigt mittlerweile allerdings auch die „Archiviert vom Original“-Links an, das hat sich in der Vorbereitung des InternetArchiveBot als nötig herausgestellt, um die MB-Auflagen zu erfüllen (Original-Link muss sichtbar sein) und gleichzeitig eine wohlformatierte Ausgabe zu erreichen.--Cirdan ± 00:51, 27. Mär. 2018 (CEST)
- Das ist für Webarchiv meiner Meinung nach nur für IABot-Links akzeptabel, und selbst diese sollten besser umgeleitet werden. Dort wo der IABot-Parameter fehlt sollte das umgehend wieder abgeschaltet werden. Welcher Mist da in die Weblinksuche gelangt, kann man ja am obigen Quarry-Link ablesen. Frohes Schaffen — Boshomi ⌨ 01:06, 27. Mär. 2018 (CEST)
Dieser Referer müsste sich doch relativ einfach auf unseren Labs nachbauen lassen, oder? Der muss doch nach meinem Verständnis nix weiter tun, als eine URL anzunehmen und auf diese weiterzuleiten. Die Verbindung bliebe gesichert und die Zugriffsdaten würden bei uns auch nicht ausgewertet werden. -- hgzh 18:17, 27. Mär. 2018 (CEST)
- @Hgzh: +1 Wünschenswert wäre das schon wenn so ein Links mit Hilfe der WMFLabs machbar wäre. Aber bis das soweit ist, brauchen wir eine Lösung.
- @Cirdan: Ich leide derzeit immer noch an extremen Zeitmangel, und bitte dich die Vorlage Webarchiv nochmal zu überarbeiten. Dieser "des Originals" sollte besser nur dann angezeigt werden, wenn gleichzeitig der IABot-Parameter gesetzt ist. Der Grund ist die Verwendung im Abschnitt Weblinks. Dort gilt die Regel das die Links dort "vom Feinsten" sein sollten. Ein bekanntermaßen toter Link gehört da definitiv nicht dazu, insbesondere da der gefixte Link ja mit dem Memento schon vorhanden ist. Frohes Schaffen — Boshomi ⌨ 23:32, 27. Mär. 2018 (CEST)
Zur Wartung der IABot Einträge allgemein: Die gefixten URLs in Internetquelle und cite web sollten weiterhin umgeleitet werden sobald ein Benutzer den Bot-Parameter entfernt hat. (zumindest bis eine bessere Lösung gefunden wird):
- Angenommen ein Inhalt auf einer Webseite wird 10 Jahre lang vorrätig gehalten, bis dieser verschwindet. Das bedeutet, dass mittelfristig die Webarchive einen Gutteil aller URLs ausmachen werden.
- Daraus folgt, dass im Falle des Anzeigens bereits gefixter toten Links über alle Zeiten, die Weblinksuche mehrheitlich nur noch tote Links liefern würde.
- Die Zeit der Wikipedianer ist beschränkt. (Ich erlebe das gerade bei mir selbst) Man sollte Inhalte so pflegen, dass der Wartungsaufwand möglichst klein bleibt. Frohes Schaffen — Boshomi ⌨ 23:32, 27. Mär. 2018 (CEST)
- @Boshomi: Ich muss mich korrigieren. Der unbubble-Link wurde von DaB. aus Vorlage:Webarchiv/Wayback gelöscht, daher kommt also die Überschwemmung in der Weblinksuche. {{Internetquelle}} ist unangetastet. Den Original-Link nur zu zeigen, wenn archiv-bot gesetzt ist, erfordert einigen Umbau in {{Webarchiv}}, da die Archivbot-Anzeige über die Hauptvorlage, die Linkgenerierung aber über die Untervorlagen erfolgt. Das ist machbar, entweder brauchen alle vier Untervorlagen einen Archivbot-Schalter oder der Original-Link wandert in den Archivbot-Hilfetext. Vorher würde ich aber gerne noch weitere Stimmen abwarten und vor allem die Sache mit dem Referer klären – kommt der Referrer nämlich nicht, muss ohnehin die Weblinksuche anders gelöst werden. Es spricht aus meiner Sicht auch wenig dagegen, grundsätzlich auch tote Links vorzuhalten – wir sollten uns hier nicht von technischen Problemen eine inhaltliche Lösung aufdrücken lassen. Behindert die Änderung von DaB. gerade laufende Arbeiten, sollte erst einmal diese Änderung auf den Status Quo zurückgesetzt werden und in Ruhe eine neue Lösung entwickelt werden.--Cirdan ± 23:55, 27. Mär. 2018 (CEST)
- Zurück auf Status Quo wäre auch meine Präferenz - es sei denn, hgzh meint, einen hauseigenen Referrer innerhalb kürzester Zeit an den Start bringen zu können.
- Ich habe mir jetzt die Untervorlagen nicht alle angeschaut, aber wäre es nicht möglich, aus allen Hauptvorlagen (Internetquelle, Webarchiv,...) die Ausgabe von einer gemeinsamen „Unter“vorlage erledigen zu lassen? Das würde Anpassungen vereinfachen und vereinheitlichen.--Mabschaaf 13:14, 28. Mär. 2018 (CEST)
- Letzteres wäre möglich, so wird es bereits bei {{Toter Link}} gehandhabt: Alle „Belegvorlagen“ binden {{Toter Link}} ein, wenn eine URL als defekt markiert ist. Das gleiche ließe sich auch mit {{Webarchiv}} machen.--Cirdan ± 14:10, 28. Mär. 2018 (CEST)
Ich habe mal einen Dereferrer zusammengehackt: //tools.wmflabs.org/giftbot/deref.fcgi?url=http://example.com/?a=b&c=d#e [Link funktioniert nicht mehr]. Technische Kritik sehr willkommen. – Giftpflanze 18:21, 28. Mär. 2018 (CEST)
- Vielen Dank! Ein erster Bug: //tools.wmflabs.org/giftbot/deref.fcgi?url=http://example.com/?a=b&query=suchbegriff scheint nicht richtig zu funktionieren.--Cirdan ± 18:25, 28. Mär. 2018 (CEST)
- Würde man auch so aufrufen: //tools.wmflabs.org/giftbot/deref.fcgi?url=
{{urlencode:http://example.com/?a=b&query=suchgegriff}}
. – Giftpflanze 18:32, 28. Mär. 2018 (CEST)
- Würde man auch so aufrufen: //tools.wmflabs.org/giftbot/deref.fcgi?url=
Nun hatte ich auch grad was aufgesetzt: https://tools.wmflabs.org/redirecter -- hgzh 18:37, 28. Mär. 2018 (CEST)
- Vielleicht könnt ihr euch kurz über die verwendete Methode austauschen und dann eine optimierte Lösung finden? tools.wmflabs.org/redirecter ist natürlich die schönere URL. Könnte die WMF ein Problem damit haben, dass auf Tool Labs ein Redirect-Service betrieben wird? Können wir technisch sicherstellen, dass nur Links aus der Wikipedia weitergeleitet werden können?--Cirdan ± 18:59, 28. Mär. 2018 (CEST)
- Ich hab die Tools-Regeln überflogen und nichts gefunden, was dagegen spräche. Eine Einschränkung auf Anfragen aus der Wikipedia wird eher nicht möglich sein, da nicht jeder den Referer mitliefert. Aber da bin ich kein Experte. Technisch wird eine kodierte URL als Parameter erwartet, dann dekodiert und diese dann im Header weitergegeben, sodass der Browser weiterleitet. -- hgzh 19:13, 28. Mär. 2018 (CEST)
- Dank an @Giftpflanze, Hgzh:. Das sieht schon recht vielversprechend aus. Ich habe beide Varianen mit URLencode mit einigen recht schwierigeren URL versucht, und es hat alles einwandfrei funktioniert.
- Der Gedanke von Cirdan, das nur auf Wikipedia-Aufrufe einzuschränken hat was für sich. Vielleicht lässt sich hier die Giftbotweblinksuche auf nützliche Weise wiederverwenden: es werden nur solche URLs weitergeleitet, wo die aufgerufene tools.wmflabs-redirecter-URL in der Datenbank auffindbar ist. Damit wäre üblicher Mißbrauch wie Phishing weitgehend verhindert. Weiternutzer können hingegen die tools.wmflabs-redirecter-URLs ohne Probleme verwenden, solange die URL in unserer externallinks-Tabelle vorhanden ist. Frohes Schaffen — Boshomi ⌨ 23:43, 28. Mär. 2018 (CEST)
- Ich habe das jetzt mal umgesetzt. – Giftpflanze 01:00, 29. Mär. 2018 (CEST)
- Ich hab die Tools-Regeln überflogen und nichts gefunden, was dagegen spräche. Eine Einschränkung auf Anfragen aus der Wikipedia wird eher nicht möglich sein, da nicht jeder den Referer mitliefert. Aber da bin ich kein Experte. Technisch wird eine kodierte URL als Parameter erwartet, dann dekodiert und diese dann im Header weitergegeben, sodass der Browser weiterleitet. -- hgzh 19:13, 28. Mär. 2018 (CEST)
- Super! Ich habe jetzt eine (Unter-)Vorlage {{Referrer|url=}} gebastelt. Funktioniert wie erwartet! Frohes Schaffen — Boshomi ⌨ 01:51, 30. Mär. 2018 (CEST)
- Wollen wir das dann mal z.B. in {{Cite web}} testen? Die wird ja nicht so oft genutzt. Ich würde zudem vorschlagen, bei Links, die nicht automatisch weitergeleitet werden, einen klickbaren Link samt Infotext/Warnung zu zeigen.--Cirdan ± 06:53, 30. Mär. 2018 (CEST)
- Habe jetzt einen Test in {{Cite news}} eingebaut, die wird wohl noch seltener verwendet. Testartikel lassen sich über Spezial:Linkliste/Vorlage:Referrer finden. Allerdings sollte die Linkbeschriftung in Referrer nicht festgelegt sein, denn wir haben „Memento des Originals“ und „Archiviert vom Original“ als mögliche Formulierungen.--Cirdan ± 14:23, 30. Mär. 2018 (CEST)
- @Cirdan: Ich habe nun einen optionalen Parameter "flexio" eingfügt. Damit sollten beide Varianten abgedeckt sein. Die Variante einen Parameter "text" einzufügen, der dann beliebigen Linktext erlaubt, ist vermutlich nicht notwendig. Die Vorlage ist als Untervorlage gedacht, und eine Verwendung für beliebige andere Zwecke als die oben beschriebenen, hätte ich vorläufig nicht vorgesehen.
- Beim Einsetzen in anderen 100.000fach verwendeten Vorlagen muss man beachten, dass es vermutlich eine Zeit lang dauert, bis alle betroffene Artikel von der Mediawikisoftware gepurged sind. Ein kurzer Eintrag auf der Diskussionseite der betroffen Vorlage kann da schon nützlich sein. Frohes Schaffen — Boshomi ⌨ 15:50, 30. Mär. 2018 (CEST)
- Habe jetzt einen Test in {{Cite news}} eingebaut, die wird wohl noch seltener verwendet. Testartikel lassen sich über Spezial:Linkliste/Vorlage:Referrer finden. Allerdings sollte die Linkbeschriftung in Referrer nicht festgelegt sein, denn wir haben „Memento des Originals“ und „Archiviert vom Original“ als mögliche Formulierungen.--Cirdan ± 14:23, 30. Mär. 2018 (CEST)
- Wollen wir das dann mal z.B. in {{Cite web}} testen? Die wird ja nicht so oft genutzt. Ich würde zudem vorschlagen, bei Links, die nicht automatisch weitergeleitet werden, einen klickbaren Link samt Infotext/Warnung zu zeigen.--Cirdan ± 06:53, 30. Mär. 2018 (CEST)
- Super! Ich habe jetzt eine (Unter-)Vorlage {{Referrer|url=}} gebastelt. Funktioniert wie erwartet! Frohes Schaffen — Boshomi ⌨ 01:51, 30. Mär. 2018 (CEST)
Umstellung der Vorlage auf Vorlage Referrer
- Cite News wurde von Cirdan schon umgestellt
- Cite Journal habe ich jetzt ungestellt. Dort kamen aber nur wendige Fälle vor.
- Inzwischen sind alle Vorlagen mit Ausnahme von Internetquelle umgestellt. Ich werde dafür eine Anfrage auf WP:AA stellen. Frohes Schaffen — Boshomi ⌨ 19:50, 31. Mär. 2018 (CEST)
- Ich habe die Umstellung der Vorlage {{Internetquelle}} auf WP:AA und Vorlage_Diskussion:Internetquelle#Umstellung_des_Referrers_von_derefer.unbubble.eu_auf_Vorlage_Referrer angekündigt. Die Umstellung werde ich vermutlich heute im Lauf des Tages umsetzen. Frohes Schaffen — Boshomi ⌨ 11:21, 1. Apr. 2018 (CEST)
- Hm, das entspricht nun aber nicht ganz dem oben besprochenen, nachdem ungeprüfte IABot-Ergänzungen nach wie vor den Originallink ohne Referrer enthalten sollten.--Mabschaaf 11:39, 1. Apr. 2018 (CEST)
- Der Original-Link beleibt ja erhalten, er steht direkt im Artikel, und die Weiterleitung läuft auf den Originallink. Die Überprüfung ob die Referrer-URL bei uns registriert ist, läuft derart schnell, dass sie von Benutzer gar nicht bemerkt wird.
- Man sollte sich über die Geschwindigkeit der manuellen Abarbeitung der Botmeldungen in den Artikeln keine Illusionen machen, der Bot wird jeden Tag mehr neue Einträge machen, als von Benutzern je abgearbeitet werden. Daher ist es notwendig, die Weblinksuche die gesamte Zeit über effizient zu halten.
- Um die Geschwindigkeit der Abarbeitung ein wenig zu verbessern habe ich auch konkrete Ideen wie man Botmeldungen in effizienter Weise manuell kontrollieren kann, um die Ergebnisse der manuellen Kontrolle an Bots (z.B. Luke081515Bot) zu übergeben, um das in den Artikel umzusetzen. Für solche Werkzeuge braucht es auf jeden Fall eine aufgeräumte Weblinksuche und hilfreiche Wartungslinks, sonst schickt man Benutzer solcher Werkzeuge immer und immer wieder in Artikel die bereits gefixt sind.
- Umabhängig davon verbessert die Umstezung des Referrers die aktuelle Situation, denn unbubble war immer nur eine Notlösung. Frohes Schaffen — Boshomi ⌨ 12:10, 1. Apr. 2018 (CEST)
- Ziel war doch, über die Weblinksuche unterscheiden zu können, ob ein Link aktiv im Artikel steht (Funktionierende Links bzw. als tot gemeldete, aber nicht bearbeitete) oder ob es sich nur um ein "Originallink" zu einer inzwischen vorhandenen Archivverlinkung handelt.
- Zu GiftBot-Zeiten reichte die Unterscheidung dieser zwei Varianten - mehr gab es ja nicht.
- Jetzt wäre es sinnvoll, eine dritte Unterscheidung zu ermöglichen: "Originallinks" zu als Tot getaggten, aber ungeprüften Links (also Links mit IABot-Markierung). Vielleicht sollten wir für diese einen zweiten Referrer mit abweichender URL verwenden?--Mabschaaf 12:17, 1. Apr. 2018 (CEST)
- Diese Prüfung ist ja möglich, sowohl manuell, als auch automatisiert. Wenn du beispielsweise mit Hilfe der Giftbotweblinksuche 100 dieser URLs auf einmal öffnest (auch Maschinell), öffnen sich die die Original-URLs. Für Leute die einfach nur den "Original"-Link anklicken ändert sich so gut wie gar nichts, der Link liefert zuverlässig die Original-URL. Für Leute die das maschinell überprüfen wollen, und beispielsweise cURL dazu verwenden, müssen die Verfolgung von Redirects aktivieren, aber das sollte sowieso die Standard-Einstellung sein.
- Die Dritte Unterschiedungsmöglichkeit ist mir durchaus bewusst, und sie ist entsprechend des Meinungsbildes auch notwendig. (ich habe gestern dazu in der Vorlage Toter Link/Core einen entsprechenden Edit umgesetzt.
- Man muss sich aber auch klar sein, dass diese Überpfüfungspflicht eine enormen Zeitbedarf bei den Benutzern auslöst, der mit derzeitigen Werkzeugen und der zur Verfügung stehenden praktisch unbewältigbar ist. Die Änderung hat auf die Unterscheidungsmöglichkeit nur marginalen Einfluss, bietet aber die Möglichkeit mit technischen Mitteln den Zeitbedarf der Wikipedianer deutlich zu reduzieren. Die beste technische Lösung ist übrigen wertlos, wenn die Umsetzung an menschlichen Kapazitäten scheitert. Abgesehen davon gibt es auch noch die ganz normale Weblinkwartung abseits der Botabarbeitung. Diese sollte durch den Bot möglichst nicht beeinträchtigt werden. Die Änderung hat also den Sinn all diese Notwendigkeiten und Anforderungen möglichst gut und strukturiert zu unterstützen. Frohes Schaffen — Boshomi ⌨ 16:43, 1. Apr. 2018 (CEST)
- Sorry, aber Du redest an mir vorbei oder schießt über das Ziel hinaus. Es geht doch nicht darum, ob es irgendwo externe Tools gibt, mit denen irgendetwas möglich ist. Es geht darum, mit Bordmitteln (und das ist die WP-Weblinksuche) zwischen folgenden Fällen unterscheiden zu können:
- aktive Links
- Links, die nur noch als "Originallink" von einer der Archiv-Vorlagen erzeugt werden
- Links, die von IABot als "tot" markiert, aber unkontrolliert sind
- Über die Weblinksuche ist (1) leicht auffindbar, (2) und (3) lassen sich jedoch nicht unterscheiden, beide beginnen mit
https://tools.wmflabs.org/giftbot/deref.fcgi?url=...
- Bei (2) ist das kein Problem, es gibt ja keinerlei Handlungsbedarf mehr. (3) jedoch erfordert noch die menschliche Kontrolle und das Entfernen des IABot-Tags.
- Stand der Diskussion war, dass nur (2) den Dereferrer-Link erhält, damit wäre (1) und (3) nicht unterscheidbar.
- Besser und mM auch technisch machbar sollte aber sein, dass man einen weiteren Parameter an den Dereferrer übergibt, der den Status beschreibt, also bspw. für (3)
https://tools.wmflabs.org/giftbot/deref.fcgi?status=unchecked?url=...
und für (2)...?status=checked...
Damit würden sich dann alle alle drei Fälle per Weblinksuche finden lassen, ohne wechselseitig verseucht zu sein.--Mabschaaf 17:02, 1. Apr. 2018 (CEST)- Für zeitsparende Abarbeitung ist natürlich eine klare Unterscheibarkeit unumgänglich. Technische Hilfsmittel sind wären gar nicht machbar. Der Referrer setzt aber an einer Stelle ein, wo manuell kontrolierte und Botmeldungen schon wieder zusammenlaufen. Für die klare Unterscheibbarkeit ist das an dieser Stelle nur mehr eingeschränkt geeignet, technisch ist es meiner Meinung nach nicht der richtige Ort. Auf der Diskseite von BD:Cirdan habe ich auch meinen Wunsch nach WartungsURLs für Bot-Markierte-Tote-Links und gefundene Wayback-Links geäußert. Für die Vorlage Toter Link habe ich das gestern umgesetzt. Siehe BD:Cirdan. Für die Vorlagen, die Mementos nutzen, baue ich gerade lokal die Vorlagen-Anpassungen und dann auch passende Quarry und giftbotweblinksuche-Links. Am Ende sollen Abfragen herauskommen, die es Benutzern erlauben, korrekte IABot-Ersetzungen als korrekt zu markieren (idealerweise mit Hilfe eines weiteren Bots, wobei ich insbesondere an Luke081515 Bot denke, das sonst gewaltige Mengen an Miniedits entstehen würden.) Frohes Schaffen — Boshomi ⌨ 19:27, 1. Apr. 2018 (CEST)
- @Mabschaaf: Vermutlich ist die Vorlage {{Referrer}} derzeit der Ort, an dem so eine Trennung am einfachsten umzustetzen wäre, man müsste bloß einen archivbot-Parameter einfügen, und dort entsprechend weiterverarbeiten. Nach der Unix-Philosophie Schreibe Computerprogramme so, dass sie nur eine Aufgabe erledigen und diese gut machen. Neige ich aber dazu, das in eine eigene Untervorlage auszulagern. Auf jeden Fall hat mich dein Beitrag geholfen, eine viel einfachere Lösung zu suchen. Frohes Schaffen — Boshomi ⌨ 20:38, 1. Apr. 2018 (CEST)
- Freut mich. Ich hatte oben meinen Beitrag auch zunächst anders verfasst: Prinzipiell könnte man ja auch einen (weiteren?) Parameter übergeben, aus welcher Vorlage der Link generiert wird, also
...?source=internetquelle...
oder...?source=webarchiv...
usw. Ich wüsste aber gerade nicht, ob es für diese Unterscheidung sinnvolle Anwendungfälle gäbe. - Auf alle Fälle müssten alle Zusatzinformationen in den Links über Wildcards in den Suchfunktionen wieder ausblendbar sein, wenn man keine Teilliste benötigt, sondern die vollständige.--Mabschaaf 21:39, 1. Apr. 2018 (CEST)
- @Mabschaaf: Ich habe inzwischen die Untervorlage {{Webarchiv/archiv-bot-core}} erstellt. Die entweder direkt oder über {{Webarchiv/archiv-bot}} aufrufbar. Sie liefert alle Hilfslinks, die man für die unterschiedlichen Use-Cases braucht, inklusive der Original-URL. Ich bin gerade am Testen, aber ich denke, das schaut schon mal ganz gut aus. Frohes Schaffen — Boshomi ⌨ 20:06, 2. Apr. 2018 (CEST)
- Freut mich. Ich hatte oben meinen Beitrag auch zunächst anders verfasst: Prinzipiell könnte man ja auch einen (weiteren?) Parameter übergeben, aus welcher Vorlage der Link generiert wird, also
- @Mabschaaf: Vermutlich ist die Vorlage {{Referrer}} derzeit der Ort, an dem so eine Trennung am einfachsten umzustetzen wäre, man müsste bloß einen archivbot-Parameter einfügen, und dort entsprechend weiterverarbeiten. Nach der Unix-Philosophie Schreibe Computerprogramme so, dass sie nur eine Aufgabe erledigen und diese gut machen. Neige ich aber dazu, das in eine eigene Untervorlage auszulagern. Auf jeden Fall hat mich dein Beitrag geholfen, eine viel einfachere Lösung zu suchen. Frohes Schaffen — Boshomi ⌨ 20:38, 1. Apr. 2018 (CEST)
- Für zeitsparende Abarbeitung ist natürlich eine klare Unterscheibarkeit unumgänglich. Technische Hilfsmittel sind wären gar nicht machbar. Der Referrer setzt aber an einer Stelle ein, wo manuell kontrolierte und Botmeldungen schon wieder zusammenlaufen. Für die klare Unterscheibbarkeit ist das an dieser Stelle nur mehr eingeschränkt geeignet, technisch ist es meiner Meinung nach nicht der richtige Ort. Auf der Diskseite von BD:Cirdan habe ich auch meinen Wunsch nach WartungsURLs für Bot-Markierte-Tote-Links und gefundene Wayback-Links geäußert. Für die Vorlage Toter Link habe ich das gestern umgesetzt. Siehe BD:Cirdan. Für die Vorlagen, die Mementos nutzen, baue ich gerade lokal die Vorlagen-Anpassungen und dann auch passende Quarry und giftbotweblinksuche-Links. Am Ende sollen Abfragen herauskommen, die es Benutzern erlauben, korrekte IABot-Ersetzungen als korrekt zu markieren (idealerweise mit Hilfe eines weiteren Bots, wobei ich insbesondere an Luke081515 Bot denke, das sonst gewaltige Mengen an Miniedits entstehen würden.) Frohes Schaffen — Boshomi ⌨ 19:27, 1. Apr. 2018 (CEST)
- Sorry, aber Du redest an mir vorbei oder schießt über das Ziel hinaus. Es geht doch nicht darum, ob es irgendwo externe Tools gibt, mit denen irgendetwas möglich ist. Es geht darum, mit Bordmitteln (und das ist die WP-Weblinksuche) zwischen folgenden Fällen unterscheiden zu können:
Die Änderung ist jetzt in allen Vorlagen umgesetzt. Jetzt bedient der IABot im Fall von Mementos zentral die Vorlage {{Webarchiv/archiv-bot}} im Fall toter Links die Vorlage {{Toter Link}}. Damit werden die Texte und Metadaten nur noch an diesen Stellen produziert. Der Link Treffer für: http://IABotmemento.invalid/% liefert alle URL, wo der IABot ein Memento gefunden hat. Dies URLs kann man zum Abgleich manuell gefundener Mementos nutzen, womit die Forderung nach Trennung von manuell recherchierter Memenotos und Botersetzungen erreicht werden kann. Frohes Schaffen — Boshomi ⌨ 23:55, 2. Apr. 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 22:00, 3. Mai 2021 (CEST)
Whitelist
Liebe Kollegen, gibt es eine Möglichkeit, Euch mitzuteilen: Ich kümmere mich um diesen Artikel, bitte nehmt ihn von Eurer Wartungsliste? Ich würde das sehr begrüßen, denn bei den recht wenigen Artikeln, zu denen ich ernsthaft beigetragen habe, kann ich ganz gut überblicken, wann ein Link von Bedeutung ist und wann nicht. --Mautpreller (Diskussion) 13:01, 31. Mär. 2018 (CEST)
- @Mautpreller: Ich selbst bin derzeit kaum aktiv, daher betrifft mich der Wunsch derzeit nicht. Aber falls so eine Whitelist existieren würde, ich würde sie strikt ignorieren, weil ein derartiges Ansinnen dem Wikiprinzip fundamental widerspricht.
- Ich bitte dich deinen Wunsch zu überdenken und neu in einer Weise zu formulieren, die mit Wikiprizipien konform geht.
- Davon abgesehen gibt es mehrere Möglichkeiten:
- irgendwo gibt es eine Wartungsseite für den IABot. Da kann dir Cirdan vermutlich weiterhelfen.
- Idealerweise pflegst du die externen URLs in deinen Artikeln proaktiv. Dafür wirst du vermutlich Werkzeuge brauchen, wobei Vieles schon existiert. Erkläre deine Arbeitsweise und deine Wünsche, dann kann vielleicht ich, vielleicht auch andere Benutzer dir ganz konkrete Hilfestellungen geben.
- Frohes Schaffen — Boshomi ⌨ 18:38, 31. Mär. 2018 (CEST)
- Niemand ist gehindert, die Artikel zu bearbeiten, das heißt jedoch nicht, dass sie auf einer Wartungsliste auftauchen müssen. Vielmehr ist die Aufnahme auf eine Wartungsliste ebenso Verhandlungssache wie jeder andere Edit auch. - Ich brauche keine Werkzeuge. Mir reicht ein schlichter Hinweis, ohne Eingriff in den Artikel. Ich möchte dann die Botschaft vermitteln: Wer mit dem Gegenstand des Artikels nicht vertraut ist, möge bitte die Füße stillhalten, ich kümmere mich darum. Sollte jemand, der den Gegenstand des Artikels gut kennt, sich daran versuchen, alles klar, kein Problem. Aber nur in diesem Fall.--Mautpreller (Diskussion) 21:21, 31. Mär. 2018 (CEST)
- Wartungslisten entstehen in aller Regel durch Vorlagen die Artikel in entsprechenden Kategorien einsortieren oder spezielle Wartungslinks erzeugen. Mir ist kein Fall einer Vorlage bekannt, die Kategorien oder Kategorie-Bäume abfragen kann, um bestimmte Kategoien auszunehmen.
- Der Satz: «Wer mit dem Gegenstand des Artikels nicht vertraut ist, möge bitte die Füße stillhalten» steht immer noch im Gegensatz zum Wikiprinzip. Wir gehen grundsätzlich davon aus, dass jeder Benutzer guten Willen ist, und mit seinem Edit den Artikel verbessern will. Wenn ein Edit nicht gut gelungen ist, bessern wir das aus, und geben eventuell Hinweise, wie man das zukünftig besser manch kann. Frohes Schaffen — Boshomi ⌨ 21:38, 31. Mär. 2018 (CEST)
- Es ist jedoch die Bedingung für Qualität, dass man sich mit Edits zurückhält, wenn man vom Gegenstand eines Artikels keine Ahnung hat.--Mautpreller (Diskussion) 11:10, 1. Apr. 2018 (CEST)
- Mein Erfahrung nach bedarf braucht es nicht viel konkretes Fachwissen um festzustellen ob ein Inhalt auf einer Webseite zum Text passt, den er belegen soll. Da reicht in aller Regel die Fähigkeit zum Lesen.
- Ich denke, dass es grundsätzlich in Wikipedia grundsätzlich nützlich ist, seine Wünsche so zu formulieren, dass sie andere nicht einschränken oder gar ausschließen. Wenn du einen konkreten Wunsch hast, der geeignet ist, die Qualität zu verbessern, und hoffentlich auch anderen in gleicher Weise zugänglich ist, dann wirst du viel leichter von geeigneten Leuten Unterstützung erhalten. Frohes Schaffen — Boshomi ⌨ 11:45, 1. Apr. 2018 (CEST)
- Nein, das ist eben nicht die Regel. Qualitätsverbesserungen sind in aller Regel nur durch Leute möglich, die sich mit dem Gegenstand des Artikels auskennen. Das ist eigentlich eine Selbstverständlichkeit, die in der Wikipedia leider zu oft missachtet wird. Es wäre schon sehr viel wert, wenn diese schlichte Wahrheit auch allgemein vertreten würde.--Mautpreller (Diskussion) 11:55, 1. Apr. 2018 (CEST)
- PS: Das bedeutet natürlich eine Einschränkung anderer Benutzer. Die Idee ist nicht: nur noch handverlesene Benutzer. Die Idee ist: prüfe Dich selbst. Verstehst Du von diesem Gegenstand was? Glaubst Du, Du kannst überblicken, ob dieser Link für den Artikel nützlich ist? Dann nur zu. Hast Du Dich nie mit diesem Gegenstand beschäftigt? Hast Du keine Vorstellung, welcher Link zum Thema informativ sein könnte und welcher überflüssig? Dann lass die Finger davon.--Mautpreller (Diskussion) 12:15, 1. Apr. 2018 (CEST)
- Es ist jedoch die Bedingung für Qualität, dass man sich mit Edits zurückhält, wenn man vom Gegenstand eines Artikels keine Ahnung hat.--Mautpreller (Diskussion) 11:10, 1. Apr. 2018 (CEST)
- Niemand ist gehindert, die Artikel zu bearbeiten, das heißt jedoch nicht, dass sie auf einer Wartungsliste auftauchen müssen. Vielmehr ist die Aufnahme auf eine Wartungsliste ebenso Verhandlungssache wie jeder andere Edit auch. - Ich brauche keine Werkzeuge. Mir reicht ein schlichter Hinweis, ohne Eingriff in den Artikel. Ich möchte dann die Botschaft vermitteln: Wer mit dem Gegenstand des Artikels nicht vertraut ist, möge bitte die Füße stillhalten, ich kümmere mich darum. Sollte jemand, der den Gegenstand des Artikels gut kennt, sich daran versuchen, alles klar, kein Problem. Aber nur in diesem Fall.--Mautpreller (Diskussion) 21:21, 31. Mär. 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 21:01, 5. Mai 2021 (CEST)
http zu https per Botauftrag?
Hi, was haltet ihr davon, URLs für Domains die mittlerweile https anbieten und auf die viel verlinkt wird per Bot zu ändern? Seiten von Tageszeitungen und sowas. --Nothingserious (Diskussion) 22:05, 10. Jun. 2018 (CEST)
- Wenn keine Probleme mit ungültigen Zertifikaten vorliegen, ist https zu bevorzugen, da damit die Benutzer etwas besser geschützt werden. Für einen generellen Botlauf würde ich noch etwas zuwarten. Nützlich wäre, wenn erkennbare tote Links möglichst alle durch den IA-Bot markiert wären, es macht keinen Sinn bei toten Links das Protokoll zu ändern. Eine abweichende Protokollangabe erschwert in machen Fällen die Auffindbarkeit in Archiven. In manchen Fällen muss auch robots.txt gesondert beachtet werden. (Ein Beispiel dafür ist der wdr, wo zweitweise nur http-URLs in den Archiven vorrätig sind, da robots.txt sämtliche https-URLs ausgeschlossen hat)
- Nützlich wäre auch eine Liste eindeutig vertrauenswürdiger Zertifizierungsstellen, um nur jene Domains umzustellen, die von diesen zertifiziert wurden. Bei manchen Zertifizierungsstellen ist auch der Typ des Zertifikates für die Qualität ausschlaggebend.
- Da ein Botbetreiber die Qualitätsbeurteilung der Zertifizierung in aller Regel viel besser hinbekommt, als ein durchschnittlicher Benutzer, wäre ein Botauftrag jedenfalls besser als das händische Umsetzen durch einzelne Benutzer. Frohes Schaffen — Boshomi ⌨ 22:09, 11. Jun. 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 13:23, 9. Mai 2021 (CEST)
rp-online.de
Die allermeisten Links auf rp-online.de (rund 8400) sind leider nicht mehr erreichbar und leiten auf die Hauptseite weiter. Wohlgemerkt nicht alle, aber die meisten. 129.206.241.137 13:37, 15. Aug. 2018 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 19:08, 11. Mai 2021 (CEST)
Versuch Wikipedia für SEO zu missbrauchen
Das ist sicherlich nicht eine Idee von gestern, jedoch fand ich keine Diskussion im Archiv. Ich wurde auf das hier aufmerksam gemacht. Meiner Meinung nach ist das keine große Gefahr, weil das viel Aufwand ist, nur um dann die Chance zu haben, dass deren Webseiten zufällig den Inhalt haben, der auf Wikipedia relevant sein könnte. "Schlimmstenfalls" ergibt sich eine win-win Situation; wir kriegen Quellen, die uns taugen und jemand profitiert noch nebenbei davon. Jedoch könnte ich das ganze falsch einschätzen und würde gerne eure Meinung dazu hören. --Anton Sachs (Diskussion) 03:55, 26. Aug. 2018 (CEST)
- Hallo @Anton Sachs:, das ist eine ziemlich detaillierte Anleitung zur Suchmaschinenoptimierung, mich wundert, dass das bislang noch niemand kommentiert hat. Nix gut. Gruß --Eduevokrit (Diskussion) 18:29, 13. Okt. 2019 (CEST)
- Was genau ist "nix gut"? Dass das Thema nicht weiter behandelt wurde, habe ich bemerkt. Ich vermute, dass hier nicht viele aktiv sind. --Anton Sachs (Diskussion) 21:53, 22. Okt. 2019 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 15:40, 13. Mai 2021 (CEST)
Marinenachrichtendienst#Weblinks
Kann mir jemand helfen den Weblink zu finden? Anscheinend komme ich dort irgend wo bei einer Datenbank raus. Und auch komisch ist, dass es die BAMA ist welches das Werk heraugegeben hatt, aber die Uni Graz den Link stellt. Evtl aus einer Vorlesung gestellter Link?--Sanandros (Diskussion) 23:07, 22. Sep. 2018 (CEST)
- Scheint das hier zu sein. Hab den Titel in Google eingegeben. --Anton Sachs (Diskussion) 08:37, 26. Sep. 2018 (CEST)
- Ok thx habe es mal korrigiert.--Sanandros (Diskussion) 04:52, 13. Dez. 2018 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 10:25, 15. Mai 2021 (CEST)
Amnesty.org Pfadstruktur
herverschoben von Wikipedia_Diskussion:Defekte_Weblinks. -- seth 10:27, 2. Nov. 2018 (CET)
- http://www.amnesty.org/en/library/asset/ACT50/001/2011/en/ea1b6b25-a62a-4074-927d-ba51e88df2e9/act500012011en.pdf ist tot, der Inhalt aber verfügbar unter https://www.amnesty.org/download/Documents/24000/act500012011en.pdf.
- http://www.amnesty.org/en/library/asset/EUR55/008/2012/en/0e8512c7-bb33-4d50-9051-d826780ff9ad/eur550082012en.html ist jetzt https://www.amnesty.org/download/Documents/24000/eur550082012en.pdf
- http://www.amnesty.org/es/library/asset/EUR11/006/1993/es/17066375-ec31-11dd-8d9d-a7825928c0bf/eur110061993en.html ist jetzt https://www.amnesty.org/download/Documents/188000/eur110061993es.pdf
Offenbar hat sich jeweils "nur" die Pfadstruktur verändert. Kann man dies automatisiert projektweit heilen? Bis zu 272 Links könnten betroffen sein. --Martina Disk. 04:45, 12. Apr. 2018 (CEST)
- gudn tach Martina!
- auf den ersten blick sieht die ersetzung nicht automatisierbar aus. aber ich habe selbst mal versucht, einen artikel neu zu finden und dabei ist mir aufgefallen, dass man zumindest fuer die meta-seiten ueber die dokumente eine automatisierbare ersetzung finden kann: (in perl-regexp-syntax)
s~https?://((?:www\.)?amnesty\.org/[a-z]{2})/library/asset(/[A-Z]+[0-9]+/[0-9]{3}/[12][0-9]{3}/[a-z]{2}/)[0-9a-f-]+/[a-z0-9]+\.(?:html|pdf)~https://$1/documents\L$2~g;
- aus den oben genannten urls wird dadurch:
- aus diesen meta-seiten koennte man nun noch die neuen download-urls fischen, allerdings halte ich die meta-seiten sogar fuer die besseren ziele, weil man dort die sprache selbst waehlen kann.
- diese ersetzung waere also schon mal moeglich; koennte ich z.b. von user:CamelBot umsetzen lassen.
- man koennte im zuge dessen auch ueberlegen, ob es bei >200 links sinnvoll waere, eine vorlage dafuer zu nutzen. hat beides seine vor-/nachteile. mir isses egal. weitere meinungen?
- fyi:@user:Boshomi. -- seth 00:37, 2. Jun. 2018 (CEST)
- Hi seth, Vorlage oder Botlauf wäre beides super. Kann dabei aber nicht helfen.--Martina Disk. 06:31, 17. Jun. 2018 (CEST)
- gudn tach!
- nachdem ich bemerkt habe, dass CamelBot noch einen bug in der link-ersetzungskomponente hat, hab ich einen ersetzungsvorgang jetzt erstmal abgebrochen. heute komm ich vermutlich nicht mehr dazu. -- seth 18:54, 17. Jun. 2018 (CEST)
- gudn tach!
- soeben ist mir aufgefallen, dass ich (bzw. CamelBot) doch noch einige uebersah. ich mach mich gleich dran und melde mich dann nochmal hier.
- zur kontrolle eignen sich special:linksearch/*.amnesty.org und special:linksearch/https://*.amnesty.org (fuer http- bzw.https-links). -- seth 09:45, 2. Nov. 2018 (CET)
- auf diskussionsseiten habe ich jetzt keine links gefixt (nur giftbot-meldungen entfernt).
- fuers archiv: ich bin primaer mit zwei regexp-ersetzungen durch den main namespace geholpert:
# first search pattern qr~(?:[a-z.]+\.)?(?<url1>amnesty\.org)/library/(?:index|print)/[a-z]{3}(?<path1>[a-z]{3}[0-9]{2})(?<num1>[0-9]{3})(?<year>[12][0-9]{3})(?:\?open&of=[a-z]{3}-[a-z]{3}|)~i; # first replacement "https://www.$+{url1}/documents/\L$+{path1}/$+{num1}/$+{year}/en"; # second search pattern qr~(?:[a-z.]+\.)?(?<url1>amnesty\.org)/(?<lang>[a-z]{2})/library/(?:asset|info)/(?<path1>[A-Za-z]+[0-9]+/[0-9]{3}/[12][0-9]{3})(?:(?:/[a-z]{2}/)?(?:[0-9a-f-]+/|dom-[A-Z]+)[a-z0-9]+\.(?:html|pdf))?~; # second replacement "https://www.$+{url1}/documents/\L$+{path1}/$+{lang}";
- (ich schreib's hier nicht in s///-syntax, weil ja webarchive-templates und sowas noch zusaetzlich beruecksichtigt werden muessen.)
- aus meiner sicht ist das thema somit erstmal erledigt, auch wenn vereinzelt noch einige ai-links defekt bzw. nur via archive-org erreichbar sind. -- seth 10:56, 2. Nov. 2018 (CET)
- Nochmal danke! Ich hab noch einige manuell ausgetauscht oder als (endgültig) tot markiert. amnesty.org/es ist erledigt. Bin mit amnesty.org/en nicht komplett fertig. Bin bis 20. http://www.amnesty.org/en/for-media/press-releases/egypt-s-disastrous-bloodshed-requires-urgent-impartial-investigation-2013-0 verlinkt von Blutbad in Kairo und Gizeh 2013 gekommen. Der nächste zu überprüfende Link wäre 21. http://www.amnesty.org/en/for-media/press-releases/israeli-government-urged-not-jail-nuclear-whistleblower-again-2010-05-12 verlinkt von Mordechai Vanunu. --Martina Disk. 05:39, 3. Nov. 2018 (CET)/07:22, 4. Nov. 2018 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 09:18, 3. Jun. 2021 (CEST)
www.friedhofsfuehrer.alter-suedfriedhof-muenchen.online
herverschoben von Wikipedia_Diskussion:Defekte_Weblinks. -- seth 10:27, 2. Nov. 2018 (CET)
Einige IPs haben vielfach Links nach https://www.friedhofsfuehrer.alter-suedfriedhof-muenchen.online/ eingebaut, die zumindest von den mir zugänglichen Rechnern aus nicht aufrufbar sind (Beispiel: Max Ainmiller). Ich habe schon etlich davon revertiert, aber jetzt ist mir der Gedanke gekommen, dass es möglicherweise an der TLD „.online“ liegen könnte. Die gibt es erst seit drei Jahren. Sind da grundsätzliche Probleme bekannt? Die Seiten funktionieren jedenfalls schon seit mindestens einer Woche nicht. (Was die Reverts betrifft: selbst falls es nur ein temporäres Problem sein sollte, dürften die Links nicht WP:WEB entsprechen. Daher bitte nicht wieder einfügen). --Rodomonte (Diskussion) 11:20, 8. Okt. 2018 (CEST)
- gudn tach Rodomonte!
- die links scheinen immer noch nicht zu funzen. die wenigen (26), die noch uebrig sind, kann man vermutlich von hand am besten entfernen/ersetzen:
- special:linksearch/*.alter-suedfriedhof-muenchen.online, special:linksearch/https://*.alter-suedfriedhof-muenchen.online
- -- seth 11:01, 2. Nov. 2018 (CET)
- Ich habe jetzt die paar reinen Weblinks entfernt, die noch übrig waren. Die anderen sind als Belege eingetragen worden. Das muss man wohl anders handhaben. --Rodomonte (Diskussion) 14:30, 2. Nov. 2018 (CET)
- gudn tach Rodomonte!
- ja, richtig. die seiten kann man zum teil via archive.org einsehen, z.b. [2].
- davon abhaengig, ob diese belege WP:BLG erfuellen, sollten sie entfernt bzw. durch den archivierten link (siehe dazu template:webarchive) ersetzt werden. ob die dann unbelegte aussage im artikel verbleibt, liegt im ermessen des autors und sollte im zweifel auf der jeweiligen diskussionsseite besprochen werden. -- seth 09:38, 3. Nov. 2018 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Bwbuz (Diskussion) 12:25, 20. Jun. 2021 (CEST)