Benutzer Diskussion:Giftpflanze/Archiv/2015/10
Statistik tote Links
Hallo Giftpflanze, hast Du eigentlich eine Erklärung dafür, warum die Zahlen von Monat zu Monat nach unten gehen? Ich würde eher ein kontinuierliches "verrotten" erwarten... --Mabschaaf 21:54, 21. Okt. 2015 (CEST)
- Es gibt Sites, die sich nicht prüfen lassen wollen, die werden dann ausgenommen (und sind dann auch nicht mehr falsch-positiv). Und dann gibt es auch Seiten, die nur temporär defekt sind, die werden dann auch nicht gemeldet. – Giftpflanze 22:03, 21. Okt. 2015 (CEST)
- Temporär defekte würde ich im Mittel immer ähnlich viele erwarten, die können es also eigentlich nicht sein.--Mabschaaf 22:22, 21. Okt. 2015 (CEST)
- Seit dem 1.9. nehme ich nicht mehr jeden Prüflauf einzeln, sondern fasse alle ab dem 1.9. zusammen. – Giftpflanze 22:26, 21. Okt. 2015 (CEST)
- Ah, das erklärt so einiges. Dann sollte aber in der Tabelle irgendwie angemerkt werden, dass die Zahlen nicht auf unabhängigen Zählungen beruhen. Vielleicht machst Du das am besten sachlich korrekt?--Mabschaaf 22:32, 21. Okt. 2015 (CEST)
- Sachlich korrekt? Wie darf ich mir das bitte vorstellen? – Giftpflanze 22:42, 21. Okt. 2015 (CEST)
- Ganz einfach: Du weißt am besten, was Du da zählst. Ich kann nur vermuten/raten. Die Wahrscheinlichkeit, dass ich da Murks hinschreibe, ist also nicht klein. Bei Dir tendiert sie gegen Null. ;-) --Mabschaaf 22:46, 21. Okt. 2015 (CEST)
- Sachlich korrekt? Wie darf ich mir das bitte vorstellen? – Giftpflanze 22:42, 21. Okt. 2015 (CEST)
- Ah, das erklärt so einiges. Dann sollte aber in der Tabelle irgendwie angemerkt werden, dass die Zahlen nicht auf unabhängigen Zählungen beruhen. Vielleicht machst Du das am besten sachlich korrekt?--Mabschaaf 22:32, 21. Okt. 2015 (CEST)
- Seit dem 1.9. nehme ich nicht mehr jeden Prüflauf einzeln, sondern fasse alle ab dem 1.9. zusammen. – Giftpflanze 22:26, 21. Okt. 2015 (CEST)
- Temporär defekte würde ich im Mittel immer ähnlich viele erwarten, die können es also eigentlich nicht sein.--Mabschaaf 22:22, 21. Okt. 2015 (CEST)
Danke für die Statistik! btw. könntest du Domains / Pfade auswerten, die besonders viele tote Links enthalten. Ev. lässt sich da bei einigen vorab vieles Fixen.
Zur Diskussion zu Webcitation: seit heute habe ich wieder eine vollständig Liste aller WebciteID samt dazugehöriger URLs. Die Vorlage {{Webarchiv}} habe ich inzwischen so geändert, dass die OriginalURL nun in der Weblinksuche angezeigt wird. Überall dort wo es Differenzen gibt, werde ich das in Kürze per Bot-Auftrag bereinigen lassen. Der letzte Auftrag mit 2700 Ersetzungen hat recht gut funktioniert. Frohes Schaffen — Boshomi ☕⌨☺ 23:51, 21. Okt. 2015 (CEST)
- Eh, die ursprüngliche URL wurde doch vorher schon angezeigt? Wäre es nicht vielleicht besser, sie nicht zu aktivieren? Domains: toollabs:giftbot/thousand-20151015 (ich muss noch mal alles checken, roempp.thieme.de dürfte z.B. gar nicht auf der Liste da stehen) – Giftpflanze 00:12, 22. Okt. 2015 (CEST)
- Danke für die Liste! Ich hoffe dass ich da den Luke081515Bot noch mit einigen Aufträgen versorgen kann. Es gibt einige Domains die aus Prinzip 404 zurückgeben, auch wenn Inhalt vorhanden ist.
- zu Webcite: nein, so sollte es sein, die Realität ist leider, dass es da Ausnahmen in relevanter Menge gibt. Oft wurde die Original-URL einfach mit der Webcitation-URL überschrieben, und genau diese Fälle will ich fixen. Das Auffinden ist dank der Liste über die ich nun verfügen nicht mehr so schwierig. Daher auch die Anfrage bei Benutzer:TMg, denn das Fixen wäre deutlich aufwendiger, würde ich das Datum überall per Hand eintragen müssen. Die Verwendung von Webcitation hat sich übrigens hier seit einem Jahr fast verdoppelt. Ich vermute da Zusammenhänge mit den Bot-Edits in enwiki. Frohes Schaffen — Boshomi ☕⌨☺ 01:11, 22. Okt. 2015 (CEST)
- Zur Liste: sieht jemand eine Möglichkeit, den Domains die zugehörigen Vorlagen (falls vorhanden) zuzuordnen, die für diese Links genutzt werden?--Mabschaaf 09:14, 23. Okt. 2015 (CEST)
- Ich habe mal eine Liste mit passenden Suchlinks auf Wikipedia:WikiProjekt Weblinkwartung/Domains im Fokus/giftbot 1000. In der Spalte Vorlage könnte man die Vorlagen dann eintragen, die tatsächlich betroffen sind. Frohes Schaffen — Boshomi ☕⌨☺ 18:57, 23. Okt. 2015 (CEST)
- Boshomi, ich dachte, der Witz wäre, dass die defekten Links nicht mehr im Artikel auftauchen, damit ich sie auch nicht melde. Wird das dann wieder geändert? – Giftpflanze 05:19, 24. Okt. 2015 (CEST)
- Ja das funktioniert aber nur, wenn die Vorlagen verwendet wurden. Bei händischen Konstruktionen funktioniert das natürlich nicht z.b.
[http://toteurl.dead/foobar tot] {{cite web|url=http://webcitation.org/123ididid |title=archiv|accessdate=2015-02-31}}
, und solche Konstruktionen kommen vor. Frohes Schaffen — Boshomi ☕⌨☺ 05:29, 24. Okt. 2015 (CEST)
- Ja das funktioniert aber nur, wenn die Vorlagen verwendet wurden. Bei händischen Konstruktionen funktioniert das natürlich nicht z.b.
- Zur Liste: sieht jemand eine Möglichkeit, den Domains die zugehörigen Vorlagen (falls vorhanden) zuzuordnen, die für diese Links genutzt werden?--Mabschaaf 09:14, 23. Okt. 2015 (CEST)
- Es gibt jetzt eine aktualisierte Liste: toollabs:giftbot/thousand-20151015c. – Giftpflanze 00:41, 24. Okt. 2015 (CEST)
- @Gifti: mM sollte die Phase jetzt dazu dienen, defekte Links, die zu Dutzenden oder Hunderten von Vorlagen erzeugt werden, noch zu fixen, bevor Du die Meldungen verteilst. Gelingt dies nicht, werden die Links auf den Diskus als defekt gemeldet. Gelingt es dagegen, sind die defekten Links ja nicht mehr im Artikel, damit meldest Du sie ja sowieso nicht mehr. Mit anderen Worten: Für Dich sehe ich keinen Handlungsbedarf.
- Was mich wundert, ist die enorme Anzahl an defekten DOI-Links. Könntest Du da mal eine (Teil-)Liste erstellen, damit man da ein wenig Ursachenforschung betreiben kann?--Mabschaaf 15:44, 24. Okt. 2015 (CEST)
- Ich bin nutzlos, nuuuutzlos, schluchz, ich wusste es. ;) Liste: toollabs:giftbot/doi-20151015b (ich hoffe die ist in Ordnung, wenn nicht, kann ich die noch schön machen) – Giftpflanze 15:57, 24. Okt. 2015 (CEST)
- Die Liste ist ok, vielen Dank. Leider haben erste Stichproben kein Muster erkennen lassen, mit dem sich eine größere Anzahl Fixes verbinden ließe. :-( --Mabschaaf 16:56, 24. Okt. 2015 (CEST)
- Irgendwie muss das gehen: der Link https://dx.doi.org/10.1890%2FES%2F0-001031 ist tot und hier gibt es das pdf: http://www.esajournals.org/doi/pdf/10.1890/ES10-00103.1 Die Frage ist, wie wir passende Suchalgorithmen finden, um die derzeitigen Fehlverlinkungen umzuleiten. 13000 tote DOI sollte jedenfalls ein Anspron sein, ein Lösung zu suchen. Derzeit ist es schon mal gut, dass das Problem aufgedeckt wurde. Frohes Schaffen — Boshomi ☕⌨☺ 17:57, 24. Okt. 2015 (CEST)
- Zwei Größenordnungen runter bitte, sind gerade nur noch 391. – Giftpflanze 23:16, 24. Okt. 2015 (CEST)
- Dann ist das nichts mehr systematisches, da dürften Tippfehler überwiegen. Was ich auch schon hatte: Unsichtbare Zeichen, die per c&p aus anderen Seiten eingeschleppt wurden mitten in der URL. Würdest Du die finden?--Mabschaaf 23:19, 24. Okt. 2015 (CEST)
- Wenn du mir Beispiele oder direkt die Zeichen sagen kannst. – Giftpflanze 12:40, 25. Okt. 2015 (CET)
- Sorry, habe ich leider nicht mehr präsent. Gab es aber, dergestalt, dass man weder im Editor noch im Difflink etwas sah, lediglich in der Differenz der Byte-Anzahl des Artikels in der VG war zu erkennen, dass da etwas war. Gerade bei DOIs, die natürlich per c&p eingefügt werden und dann in einer URL landen, ist so etwas fatal.--Mabschaaf 13:21, 25. Okt. 2015 (CET)
- Ich habe jetzt mal nach dem Left-to-Right-Mark gesucht, da gibts tatsächlich 415 Ergebnisse. – Giftpflanze 22:46, 25. Okt. 2015 (CET)
- Sorry, habe ich leider nicht mehr präsent. Gab es aber, dergestalt, dass man weder im Editor noch im Difflink etwas sah, lediglich in der Differenz der Byte-Anzahl des Artikels in der VG war zu erkennen, dass da etwas war. Gerade bei DOIs, die natürlich per c&p eingefügt werden und dann in einer URL landen, ist so etwas fatal.--Mabschaaf 13:21, 25. Okt. 2015 (CET)
- Wenn du mir Beispiele oder direkt die Zeichen sagen kannst. – Giftpflanze 12:40, 25. Okt. 2015 (CET)
- Dann ist das nichts mehr systematisches, da dürften Tippfehler überwiegen. Was ich auch schon hatte: Unsichtbare Zeichen, die per c&p aus anderen Seiten eingeschleppt wurden mitten in der URL. Würdest Du die finden?--Mabschaaf 23:19, 24. Okt. 2015 (CEST)
- Zwei Größenordnungen runter bitte, sind gerade nur noch 391. – Giftpflanze 23:16, 24. Okt. 2015 (CEST)
- Irgendwie muss das gehen: der Link https://dx.doi.org/10.1890%2FES%2F0-001031 ist tot und hier gibt es das pdf: http://www.esajournals.org/doi/pdf/10.1890/ES10-00103.1 Die Frage ist, wie wir passende Suchalgorithmen finden, um die derzeitigen Fehlverlinkungen umzuleiten. 13000 tote DOI sollte jedenfalls ein Anspron sein, ein Lösung zu suchen. Derzeit ist es schon mal gut, dass das Problem aufgedeckt wurde. Frohes Schaffen — Boshomi ☕⌨☺ 17:57, 24. Okt. 2015 (CEST)
- Die Liste ist ok, vielen Dank. Leider haben erste Stichproben kein Muster erkennen lassen, mit dem sich eine größere Anzahl Fixes verbinden ließe. :-( --Mabschaaf 16:56, 24. Okt. 2015 (CEST)
- Ich bin nutzlos, nuuuutzlos, schluchz, ich wusste es. ;) Liste: toollabs:giftbot/doi-20151015b (ich hoffe die ist in Ordnung, wenn nicht, kann ich die noch schön machen) – Giftpflanze 15:57, 24. Okt. 2015 (CEST)
- zu Webcite: nein, so sollte es sein, die Realität ist leider, dass es da Ausnahmen in relevanter Menge gibt. Oft wurde die Original-URL einfach mit der Webcitation-URL überschrieben, und genau diese Fälle will ich fixen. Das Auffinden ist dank der Liste über die ich nun verfügen nicht mehr so schwierig. Daher auch die Anfrage bei Benutzer:TMg, denn das Fixen wäre deutlich aufwendiger, würde ich das Datum überall per Hand eintragen müssen. Die Verwendung von Webcitation hat sich übrigens hier seit einem Jahr fast verdoppelt. Ich vermute da Zusammenhänge mit den Bot-Edits in enwiki. Frohes Schaffen — Boshomi ☕⌨☺ 01:11, 22. Okt. 2015 (CEST)