Vorlage Diskussion:Webarchiv/Webcite

aus Wikipedia, der freien Enzyklopädie

Umrechnung der WebciteID in ein Datum

Die alphanumerische 9-stellige ID entspricht ist die Base62 Angabe der numerischen ID. Da diese IDs einen auf Microsekunden genauen Unix-timestamp repräsentieren, wäre eine direkte Ausgabe des Datum aus der ID mathematisch möglich. Benutzer:PerfektesChaos hat auch schon eine funktionierende Umrechnungsfunktion auf Beta erstellt, diese müsste allerdings erst hierher übertragen werden.

Ich sehe hier einen gewissen Arbeitsbedarf, weil derzeit viel Original-URLs getrennt von der dazupassenden Webcite-URL stehen, und dies zu False-Postiv-Ergebnissen beim Botlauf sorgen könnte. Da ich nicht in der Lage bin 12000 Links bis zum Botlauf manuell zu kontrollieren, würde ich zumindest während des Botlaufs versuchen, diese False-Positiven so schnell wie möglich zu entdecken und manuell zu korrigieren. Wenn möglich würde ich gerne diese Vorlage dazu verwenden, da dies dank der Userscripts derzeit die arbeitstechnisch einfachste Lösung darstellt. Wenn ich mit der Arbeit nachkomme, will ich auch die gelegentlich fehlenden Original-URLs in die Artikel nachtragen. Frohes Schaffen — Boshomi ☕⌨☺  20:39, 9. Nov. 2014 (CET)

Ich habe die Entsperrung von Modul:Expr beantragt. Du kannst es beobachten und siehst dann auch, wann base62 verfügbar ist. VG --PerfektesChaos 23:13, 9. Nov. 2014 (CET)

Seltsames Datum

Die Suche liefert momentan 46 Treffer mit den Jahr 2386 als angebliches Datum des Mementos. Das ist mehr als offensichtlich Blödsinn. Überhaupt liefert die Suche nach Webcite zu viele Daten aus der Zukunft. --Wurgl (Diskussion) 12:53, 25. Nov. 2021 (CET)

@: du hast da die meisten Änderungen gemacht. Wo steht die Info zu der ID? Mir scheint, es ist hier durch 864000 zu dividieren, aber ohne Doku ist das nur Ratespiel. --Wurgl (Diskussion) 14:44, 30. Nov. 2021 (CET)
Hallo da scheint ganz allgemein die Rückgabe vom Modul nicht genau so zu sein wie sie mal war. Eventuell hat sich da in den Modulen etwas getan.
siehe zum Beispeil: https://web.archive.org/web/20170329071253/https://de.wikipedia.org/wiki/Zyklonsaison_im_S%C3%BCdwestindik_2006%E2%80%932007 dort hat in der Referenz 19 die Vorlage den Link 5O4MI72xu noch korrekt nach 13. April 2007 aufgelöst, nun steht dort 23. Oktober 2342 mit dem selben Parameter-Wert
Die Formel stand seit 14. November 2014 so drinnen nachdem user:PerfektesChaos die dafür notwendige Base62 Formel in Modul:Expr angelegt hatte.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 18:14, 30. Nov. 2021 (CET)
Ich habe diesen Fehler nun auch auf WP:VWS#Kombination_von_Vorlagenprogrammierung_und_Modul:Expr/base62_funktioniert_nicht_mehr_wie_früher erwähnt.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 18:24, 30. Nov. 2021 (CET)
Mir hängt es ja schon das Hirn bei base62 aus. Ich wandle dieses 5O4MI72xu in 1268053085389996 um, egal ob mit dem Code aus [1] oder aus [2], {{#invoke:Expr|base62|5O4MI72xu}} erzeugt aber 1176466901991858. Nun ist 1268053085389996 etwas größer als 1176466901991858 und entsprechend würde das ein Datum 31. Oktober 2371 ergeben. Deshalb steh ich da komplett auf der Seife und hab echt keinen Schimmer wo der Wurm ist. --Wurgl (Diskussion) 19:19, 30. Nov. 2021 (CET)
Kann es sein, dass {{#invoke:Str|sub|<string>|1|11}} früher mal von Zeichen 1 bis 11 geliefert hat und jetzt von Zeichen 1 Länge 11 liefert?
{{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{#invoke:Expr|base62|5O4MI72xu}}|1|11}}/86400}} }} days}} liefert falsches Datum 23. Oktober 2342
{{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|{{#invoke:Expr|base62|5O4MI72xu}}|1|10}}/86400}} }} days}} liefert das erwartete Datum 13. April 2007
Was aber nix daran ändert, dass unser base62 was anderes erzeugt, als im Netz gefundener Code. --Wurgl (Diskussion) 19:46, 30. Nov. 2021 (CET)

Schöner Tipp.

  • Kürzlich wurde freihändig und gegen meinen ausdrücklichen Rat mal so eben das Verhalten und die Zählung von Vorlage:str sub freihändig verändert.
  • Das bin ich schon gewohnt, ich kommentiere das sich seit 2013 hinziehende inkompetente Rumgepfusche nicht mehr weiter.
  • Diese Vorlage ist von Anfang an ohne Not und ohne Dringlichkeit mit einem schweren Programmierfehler belastet worden.
  • Ursächlich war, dass es niemals eine saubere Testseite gegeben hatte, die das erwartete und das tatsächliche Verhalten (und unsere Vorlagenprogrammierung vor 2013) leicht erkennbar für alle relevanten Parameterkombinationen gegenübergestellt und durchgespielt hätte. Vielmehr wurden die Veränderungen immer direkt am produktiven Bestand im ANR „erprobt“, und wenn sich hinterher keine Autoren beschwert hatten, dann musste die Veränderung ja völlig in Ordnung gewesen sein.

VG --PerfektesChaos 20:22, 30. Nov. 2021 (CET)

Bleibt noch mein Problem mit base62, 1268053085389996 würde den 8. März 2010 ergeben. Das kann auch richtig sein. Leider ist Webcite momentan im Bobbes, da kommen nur Fehlermeldungen. --Wurgl (Diskussion) 20:55, 30. Nov. 2021 (CET)
Es liegt aus meiner Sicht an der Implementierung im Modul, allerdings ist diese nicht fehlerhaft. Es werden aus meiner Sicht verschiedene Reihenfolgen für die Basiswerte festgelegt:
0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ [3] englisch base 62 ‚duohexagesimal‘
0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz [4] base62
richtig ist offensichtlich (im Modul implementiertes) letzteres, da wie folgt:
{{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|1268053085389996|1|10}}/86400}} }} days}} liefert falsches Datum 8. März 2010
{{#time: j. F Y| 19700101000000 + {{#expr: floor {{#expr: {{#invoke:Str|sub|1176466901991858|1|10}}/86400}} }} days}} liefert richtiges Datum 13. April 2007
somit ergeben sich daraus zwangsweise Abweichungen. --darkking3 Թ 21:23, 30. Nov. 2021 (CET)
Ach ja: Einfach mal aus Wikipedia:Lua/Modul/Expr/Test 5koEQKsfx bzw. 1256548026610369 testweise eingeben, dann ergibt sich das. --darkking3 Թ 21:26, 30. Nov. 2021 (CET)
Bin auch gerade selber darüber gestolpert, dass es wohl einen Unterschied macht, ob man Zahlen nach base62 oder nach base 62 codiert. englisch base 62 ‚duohexagesimal‘ beschreibt die Codierung zur Basis 62, Base62 ist hierzu nicht identisch. Da geht einem doch das Herz auf… --darkking3 Թ 21:39, 30. Nov. 2021 (CET)
Ich habe das jetzt mal dank eurer Hinweise mal mit einem Notfix bereinigt. Auf der Seite Polen findet sich ein Beispiel, an dem man erkennt, dass das so passen könnte. Leider ist Webcite derzeit nicht erreichbar, sodass dieser Fix weiter beobachtet werden muss. Es gibt auch wenige dezimale IDs, die habe ich vorläufig noch nicht geändert, da muss ich erst die Beispiele finden.  Frohes Schaffen —  Defekte URLs - Hilf mit! [​ɪ​​u:] 23:55, 30. Nov. 2021 (CET)