Benutzer Diskussion:WikispiderBot

aus Wikipedia, der freien Enzyklopädie

Dieser Bot ist dauerhaft inaktiv! Diese Diskussionsseite bitte nicht bearbeiten, eingehende Nachrichten werden nicht beantwortet!


Für die Gründe siehe hier und hier. -- Uwe Martens (Diskussion) 08:00, 29. Mai 2021 (CEST)

Botlauf Mai 2021

Wie in der Redaktion Chemie im Abschnitt Test-Botlauf besprochen (Permanentlink), steht folgender Botlauf an: Prüfung und Aktualisierung von 34.769 Artikeln aus der Kategorie:Chemie (samt aller Unterkategorien), die Artikelliste liegt bereits in meiner lokalen Datenbank.

Die jeweiligen Einzelfunktionen dieses Botlaufs:

  • Auslesen des Lemmas aus der Datenbank
  • Wiki-Quelltext abrufen
  • Abfrage der Wikidata Q-Nummer des Lemmas (Wikipedia API)
  • Abfrage der CAS-Nummer des Lemmas (Wikidata API)
  • Zuordnung der Q-Nummer zu beliebiger CAS-Nummer:
  • Abruf des Lemmas der CAS-Nummer (wikidata-todo.toolforge.org)
  • Abruf der Q-Nummer der CAS-Nummer (Wikidata API)
  • Erkennung und Verschlüsselung von Dateinamen mit CAS-Nummern (.svg, .jpg und .png, freistehend und in Galerien), Linktexten, Wayback-Links, Quelltext-Kommentaren, ISBN-Nummern und Einzelnachweisen mit <ref>-Tags (jeweils mit und ohne Parameter name=, eingeschlossene Vorlagen aus dem Fachbereich Chemie ausgenommen), zum Quelltextschutz
  • Prüfung bereits eingebundener Vorlage:CASRN (via CAS-API):
  • ohne zusätzliche Parameter, ggf. Markierung mit Parameter KeinCASLink=1 und Einfügung der zugehörigen Wikidata-Q-Nummer, sofern eine im Artikel auftauchende CAS-Nummer nicht dem Lemma entspricht
  • mit zusätzlichen Parametern (sonst wie zuvor)
  • Prüfung freistehender CAS-Nummern ohne eingebundene Vorlage:CASRN (via CAS-API):
  • mit nachfolgendem Zeilenumbruch (sonst wie zuvor)
  • mit &nbsp; als führendes Leerzeichen (sonst wie zuvor)
  • mit voranstehendem (normalem) Leerzeichen, wegen überlappender Suchmuster in zwei Durchgängen (sonst wie zuvor)
  • mit voranstehendem Sternchen ∗ ohne Leerzeichen dazwischen, Ergänzung des Leerzeichens (sonst wie zuvor)
  • nach Zeilenumbrüchen mit <br/> und <br />, wegen überlappender Suchmuster in je zwei Durchgängen (sonst wie zuvor)
  • innerhalb von Tabellenspalten ohne Leerzeichen, wegen überlappender Suchmuster in zwei Durchgängen (sonst wie zuvor)
  • Prüfung der CAS-Nummern aus Vorlage:Substanzinfo (via CAS-API), ggf. Markierung mit Parameter KeinCASLink=1
  • Prüfung der CAS-Nummern aus Vorlage:ChemID (mit Parametern Name und/oder Abruf, Abfrage des Namens via ChemID-Linkcheck) , ggf. Markierung mit Parameter KeinChemIDLink=1
  • Prüfung der CAS-Nummern aus Vorlage:ChemID (nur mit CAS Parameter), sonst wie zuvor
  • Prüfung aller CAS-Nummern auf Umleitungen zu anderer RN, Hinweis in der Zusammenfassung und Erstellung einer CSV-Logfile
  • Ersetzung obsoleter Datumsformate in 48 Vorlagen (mit/ohne führendes Leerzeichen für Parameter Abrufdatum, Abruf und Datum)
  • Ersetzung obsoleter Datumsformate in 48 Vorlagen mit No-Break-Leerzeichen (&nbsp), sonst wie zuvor
  • Ersetzung fehlerhafter Parameter für Datum im gesamten Quelltext, Suchschema Datum=TT.MM.JJJJ (jeweils mit Klein- und Großschreibung)
  • Ersetzung fehlerhafter Parameter für Abruf im gesamten Quelltext, Suchschema Abruf=TT.MM.JJJJ (jeweils mit Klein- und Großschreibung)
  • Entfernung von Leerzeichen vor den Parametern in 48 Vorlagen aus dem Fachbereich Chemie
  • Entfernung eines obsoleten Punktes nach Vorlage:GESTIS
  • Änderung des Wikilinks bei Verweis [[IUPAC]] (der in Infoboxen in <small>-Tags eingefaßt ist)
  • Sortierung der Parameter in Vorlage:Alfa, Vorlage:RömppOnline und Vorlage:Sigma-Aldrich
  • Entfernung des unnötigen Parameters "kurz" in Vorlageneinbindungen {{PubChem|...|kurz}}
  • Einsetzung neuer Parameterbezeichner EG-Nummer, ECHA-ID, ChemSpider und DrugBank in Einbindungen der Vorlage:Infobox Chemikalie, sofern noch nicht vorhanden
  • Quelltextbereinigung, sofern im Artikel wenigstens eine der vorstehenden Änderungen vorgenommen wurden:
  • Entfernung von Leerzeichen vor und nach den Parameterstrichen in Vorlagen Alfa, Carl Roth, ChemID, CLH-ECHA, GESTIS, REACH, RömppOnline und Sigma-Aldrich
  • Entfernung von Leerzeichen nur vor den Parameter-Bezeichnern in allen sonstigen Vorlagen aus dem Fachbereich Chemie
  • Löschung einer Leerzeile vor jeweils 13 Infoboxen aus dem Fachbereich Chemie
  • Einfügung einer Leerzeile nach jeweils 13 Infoboxen aus dem Fachbereich Chemie (bei nur einem Zeilenumbruch zwischen Infobox-Ende }} und '''Lemma''' wird ein weiterer Zeilenumbruch eingefügt)
  • Entfernung überflüssiger Parameter sprache=deutsch, sprache=de-DE, sprache=de, sprache=de-de und sprache=DE in sämtlichen Vorlagen
  • Leerzeichenersetzung zwischen Ref-Tags und Vorlagen (<ref> {{ und }} </ref>)
  • Ersetzung doppelter Leerzeichen am Ende aller Vorlagen (... }})
  • Entschlüsselung von Dateinamen mit CAS-Nummern (.svg, .jpg und .png, freistehend und in Galerien), Linktexten, Wayback-Links, Quelltext-Kommentaren, ISBN-Nummern und Einzelnachweisen mit <ref>-Tags (jeweils mit und ohne Parameter name=)

Die ersten obligatorischen 50 Testedits wurden vollautomatisch durchlaufen (globale Variablen mit verschachtelten Arrays mußten noch geresettet werden). Nach Einarbeitung zusätzlicher kleinerer Tasks aus der Redaktion Chemie wurden weitere Testedits durchlaufen. Allfällige Updates wurden auf meiner BD besprochen, implementiert und getestet (Permanentlink). Es wird dann zunächst das Bot-Flag beantragt (Permanentlink).

-- Uwe Martens (Diskussion) 01:33, 25. Mai 2021 (CEST)

Log-Files

Anbei die tabellarischen Log-Files aus vorstehendem Botlauf: