Benutzer Diskussion:WikispiderBot
Dieser Bot ist dauerhaft inaktiv! Diese Diskussionsseite bitte nicht bearbeiten, eingehende Nachrichten werden nicht beantwortet!
|
||
---|---|---|
|
Botlauf Mai 2021
Wie in der Redaktion Chemie im Abschnitt Test-Botlauf besprochen (Permanentlink), steht folgender Botlauf an: Prüfung und Aktualisierung von 34.769 Artikeln aus der Kategorie:Chemie (samt aller Unterkategorien), die Artikelliste liegt bereits in meiner lokalen Datenbank.
Die jeweiligen Einzelfunktionen dieses Botlaufs:
- Auslesen des Lemmas aus der Datenbank
- Wiki-Quelltext abrufen
- Abfrage der Wikidata Q-Nummer des Lemmas (Wikipedia API)
- Abfrage der CAS-Nummer des Lemmas (Wikidata API)
- Zuordnung der Q-Nummer zu beliebiger CAS-Nummer:
- Abruf des Lemmas der CAS-Nummer (wikidata-todo.toolforge.org)
- Abruf der Q-Nummer der CAS-Nummer (Wikidata API)
- Erkennung und Verschlüsselung von Dateinamen mit CAS-Nummern (.svg, .jpg und .png, freistehend und in Galerien), Linktexten, Wayback-Links, Quelltext-Kommentaren, ISBN-Nummern und Einzelnachweisen mit
<ref>
-Tags (jeweils mit und ohne Parametername=
, eingeschlossene Vorlagen aus dem Fachbereich Chemie ausgenommen), zum Quelltextschutz - Prüfung bereits eingebundener Vorlage:CASRN (via CAS-API):
- ohne zusätzliche Parameter, ggf. Markierung mit Parameter
KeinCASLink=1
und Einfügung der zugehörigen Wikidata-Q-Nummer, sofern eine im Artikel auftauchende CAS-Nummer nicht dem Lemma entspricht - mit zusätzlichen Parametern (sonst wie zuvor)
- ohne zusätzliche Parameter, ggf. Markierung mit Parameter
- Prüfung freistehender CAS-Nummern ohne eingebundene Vorlage:CASRN (via CAS-API):
- mit nachfolgendem Zeilenumbruch (sonst wie zuvor)
- mit
als führendes Leerzeichen (sonst wie zuvor) - mit voranstehendem (normalem) Leerzeichen, wegen überlappender Suchmuster in zwei Durchgängen (sonst wie zuvor)
- mit voranstehendem Sternchen ∗ ohne Leerzeichen dazwischen, Ergänzung des Leerzeichens (sonst wie zuvor)
- nach Zeilenumbrüchen mit
<br/>
und<br />
, wegen überlappender Suchmuster in je zwei Durchgängen (sonst wie zuvor) - innerhalb von Tabellenspalten ohne Leerzeichen, wegen überlappender Suchmuster in zwei Durchgängen (sonst wie zuvor)
- Prüfung der CAS-Nummern aus Vorlage:Substanzinfo (via CAS-API), ggf. Markierung mit Parameter
KeinCASLink=1
- Prüfung der CAS-Nummern aus Vorlage:ChemID (mit Parametern
Name
und/oderAbruf
, Abfrage des Namens via ChemID-Linkcheck) , ggf. Markierung mit ParameterKeinChemIDLink=1
- Prüfung der CAS-Nummern aus Vorlage:ChemID (nur mit
CAS
Parameter), sonst wie zuvor - Prüfung aller CAS-Nummern auf Umleitungen zu anderer RN, Hinweis in der Zusammenfassung und Erstellung einer CSV-Logfile
- Ersetzung obsoleter Datumsformate in 48 Vorlagen (mit/ohne führendes Leerzeichen für Parameter
Abrufdatum
,Abruf
undDatum
) - Ersetzung obsoleter Datumsformate in 48 Vorlagen mit No-Break-Leerzeichen (
 
), sonst wie zuvor - Ersetzung fehlerhafter Parameter für
Datum
im gesamten Quelltext, SuchschemaDatum=TT.MM.JJJJ
(jeweils mit Klein- und Großschreibung) - Ersetzung fehlerhafter Parameter für
Abruf
im gesamten Quelltext, SuchschemaAbruf=TT.MM.JJJJ
(jeweils mit Klein- und Großschreibung) - Entfernung von Leerzeichen vor den Parametern in 48 Vorlagen aus dem Fachbereich Chemie
- Entfernung eines obsoleten Punktes nach Vorlage:GESTIS
- Änderung des Wikilinks bei Verweis
[[IUPAC]]
(der in Infoboxen in<small>
-Tags eingefaßt ist) - Sortierung der Parameter in Vorlage:Alfa, Vorlage:RömppOnline und Vorlage:Sigma-Aldrich
- Entfernung des unnötigen Parameters "kurz" in Vorlageneinbindungen
{{PubChem|...|kurz}}
- Einsetzung neuer Parameterbezeichner
EG-Nummer
,ECHA-ID
,ChemSpider
undDrugBank
in Einbindungen der Vorlage:Infobox Chemikalie, sofern noch nicht vorhanden - Quelltextbereinigung, sofern im Artikel wenigstens eine der vorstehenden Änderungen vorgenommen wurden:
- Entfernung von Leerzeichen vor und nach den Parameterstrichen in Vorlagen Alfa, Carl Roth, ChemID, CLH-ECHA, GESTIS, REACH, RömppOnline und Sigma-Aldrich
- Entfernung von Leerzeichen nur vor den Parameter-Bezeichnern in allen sonstigen Vorlagen aus dem Fachbereich Chemie
- Löschung einer Leerzeile vor jeweils 13 Infoboxen aus dem Fachbereich Chemie
- Einfügung einer Leerzeile nach jeweils 13 Infoboxen aus dem Fachbereich Chemie (bei nur einem Zeilenumbruch zwischen Infobox-Ende
}}
und'''Lemma'''
wird ein weiterer Zeilenumbruch eingefügt) - Entfernung überflüssiger Parameter
sprache=deutsch
,sprache=de-DE
,sprache=de
,sprache=de-de
undsprache=DE
in sämtlichen Vorlagen - Leerzeichenersetzung zwischen Ref-Tags und Vorlagen (
<ref> {{
und}} </ref>
) - Ersetzung doppelter Leerzeichen am Ende aller Vorlagen (
... }}
)
- Entschlüsselung von Dateinamen mit CAS-Nummern (.svg, .jpg und .png, freistehend und in Galerien), Linktexten, Wayback-Links, Quelltext-Kommentaren, ISBN-Nummern und Einzelnachweisen mit
<ref>
-Tags (jeweils mit und ohne Parametername=
)
Die ersten obligatorischen 50 Testedits wurden vollautomatisch durchlaufen (globale Variablen mit verschachtelten Arrays mußten noch geresettet werden). Nach Einarbeitung zusätzlicher kleinerer Tasks aus der Redaktion Chemie wurden weitere Testedits durchlaufen. Allfällige Updates wurden auf meiner BD besprochen, implementiert und getestet (Permanentlink). Es wird dann zunächst das Bot-Flag beantragt (Permanentlink).
-- Uwe Martens (Diskussion) 01:33, 25. Mai 2021 (CEST)
Log-Files
Anbei die tabellarischen Log-Files aus vorstehendem Botlauf:
- CAS Nummern aus Vorlage CASRN (14.820 Einträge)
- CAS Nummern aus Vorlage ChemID (510 Einträge)
- CAS Nummern aus Vorlage Substanzinfo (559 Einträge)
- CAS Nummern umgeleitet (133 Einträge)