Benutzer Diskussion:Gymel/DNB-Portal

aus Wikipedia, der freien Enzyklopädie

Splitten

Hi @Gymel: kannst du die Liste splitten? Das Abspeichern von Korrekturen dauert leider ewig. --Kolja21 (Diskussion) 21:44, 6. Sep. 2014 (CEST)

Vielleicht beim nächsten Mal. Ich habe außerdem den Eindruck, dass @APPER: prüft, ob sich da botmäßig ;-) was machen lässt. Und ganz unterschwellig ventiliere ich, ob mit AWB nicht was zu machen wäre, z.B. bei Diskrepanzen zwischen den Parametern bei den Vorlagen Normdaten und DNB-Portal. Vielleicht lässt Du die Listen einfach so stehen und ich verspreche, sie bereits beim nächsten Dump von dewiki aktualisiert einzustellen? -- Thomas Berger (Diskussion) 12:45, 7. Sep. 2014 (CEST)
Ja, die Liste ist sehr lang, da kann man mal überlegen, mit einem Bot ranzugehen. Ich schau mir die Listen mal an und poste, was mir dazu einfällt:
"Unbekannte Nummern". Sehr unterschiedliche Fehler, von doch korrekten Nummern (1015163947) über Unsinn hin zu echten 404-Antworten, viele Weiterleitungen auf echte GNDs (die, die mit zwei Nullen beginnen, z.B. 005150221). Vieles sind aber auch einfach nur Werke. Ich könnte auf jeden Fall mal die Liste durchchecken und aufteilen in 404er, Weiterleitungen und Werke. Dann könnte man weiterüberlegen.
"Veraltete Normdatennummern": Das hat echtes Bot-Potential. Alles, was ich mir testweise angeschaut hab, sind Weiterleitungen auf korrekte neue GNDs. Und bei den Normdaten ist diese Anpassung fast immer schon geschehen. Ich denke ein Bot, der die GND in der DNB-Portal-Vorlage anpasst, wenn die neue GND auch in der Normdaten-Vorlage eingetragen ist, sollte völlig unproblematisch sein. Da kann ich mir auch keinen wirklichen Fehlerfall vorstellen.
"Entitätenfehler": Das ist natürlich der große Batzen. Da würde ich bei Gelegenheit auch mal einen Check laufen lassen. Einzelne wenige Tns sind leer, da müssen die Artikel auf jeden Fall durchgegangen werden. Der große Rest ist kritisch. Was sollen wir damit machen? Eigentlich muss das alles der DNB gemeldet werden, aber die kommt ja sowieso nicht nach. Also: Was tun? Aus den 6500 Fällen könnte man sicher durch automatische Prüfungen (z.B. taucht ein Werktitel der Tn im WP-Artikel auf?) ziemlich sichere Fälle zur Meldung generieren. Aber die DNB wird sich bedanken, wenn ich 1000 solche Einträge automatisiert auf WP:PND/F packe... Also diese Liste ist weniger unser Problem, würd ich sagen... --APPER\☺☹ 19:57, 7. Sep. 2014 (CEST)
Klingt vielversprechend: Danke euch beiden! --Kolja21 (Diskussion) 21:38, 7. Sep. 2014 (CEST)

Bot-Abarbeitung: Veraltete Normdatennummern

Ich mach mal einen Extra-Abschnitt auf. Also das sieht sehr gut aus, ihr könnt euch ja die Edits vom APPERbot anschauen. Einziges Problem, das ich bisher bemerkt habe ist, dass er ausschließlich das eine Problem löst. Siehe Spezial:Diff/133818508. Dass auch GNDName angepasst werden muss, ist mir ein wenig zu komplex, das in diesem Lauf mitzuerledigen. Edits kosten fast nichts, also lieber nur das jetzt machen, auf Benutzer:Gymel/GND-Probleme steht sie ja weiterhin. Ansonsten läuft das ziemlich gut durch. Es gibt einige Fälle, die der Bot nicht macht, aber das scheint okay (zweimal Vorlage:DNB-Portal; sowohl DNB-Portal als auch Normdaten-Vorlage leiten auf neue GND weiter). Ich hab jetzt mal nach 25 Edits abgebrochen, ihr könnt hier mal reinschauen. Wenn alles okay ist, würd ich demnächst alle durchlaufen lassen und die übrig gebliebenen dann hier wieder posten. --APPER\☺☹ 22:42, 7. Sep. 2014 (CEST)

Sieht gut aus! Sind auch einige Fälle dabei, die bei der Abarbeitung von WP:GND/F übersehen wurden, was ja auch verständlich ist, da sich die Liste in erster Linie auf die Normdatenvorlage bezieht. --Kolja21 (Diskussion) 12:18, 8. Sep. 2014 (CEST)

So, der Bot ist durch. 77 sind übrig geblieben, da müsste man mal von Hand ran. --APPER\☺☹ 22:49, 8. Sep. 2014 (CEST)

Vielen Dank, das passt: Benutzer:Gymel/GND-Probleme#Veraltete_Normdaten weist in flüchtig gezählt 72 Fällen darauf hin, dass auch die Vorlage DNB-Portal Anpassungsbedarf hat. -- Thomas Berger (Diskussion) 06:46, 9. Sep. 2014 (CEST)

Unbekannte Nummern

Hi, ich hab den Abschnitt "Unbekannte Nummern" in drei Teilabschnitte aufgeteilt. Der erste sind echte fehlerhafte Nummern, da muss man von Hand ran. Bei manchen (ISBNs) wird im Artikel was richtiges angezeigt, aber meiner Meinung nach sind das so wenige Fälle, dass wir die lieber auch grade ziehen sollten zu einer korrekten Nummer. Der zweite sind Nummern, die im DNB-Portal automatisch auf eine korrekte GND weiterleiten. Der dritte Teilabschnitt enthält Werke. Beim diesem Teilabschnitt kann man meiner Meinung nach nichts machen. Die Frage ist, was wir mit den weiterleitenden Nummern machen. --APPER\☺☹ 23:40, 7. Sep. 2014 (CEST)

Die Nrn. stammen (wie mit dem Hinweis zu den "Pica-Produktions-Nummern" schon angedeutet) teilweise aus VIAF. Beispiel:
Bei Wikidata ist es übrigens üblich, die Normdaten automatisiert aus VIAF zu übernehmen. Die formal fehlerhaften Einträge werden anschließend per Bot aussortiert, s. d:Wikidata:Database reports/Constraint violations/P227#"Format" violations. --Kolja21 (Diskussion) 12:42, 8. Sep. 2014 (CEST)
Ich denke auch, dass Du den zweiten Fall der Unbekannten Nummern wie die Umlenkungen oben bot-bearbeiten kannst. Der Abschnitt "Werke" ist viel (aber auch ergiebige) Arbeit: Bei Personen ist es einfach, die Literatur passt meist und man kann dann schematisch weiter ermitteln. Zeitschriften und Schriftenreihen hingegen eher eklig: Meist fehlt die Vorlage:Infobox Publikation noch ganz und die ZDB-Nummer lässt sich nicht im DNB-Portal ermitteln, muss also im ZDB-OPAC nachrecherchiert werden. Freu mich schon :-< -- Thomas Berger (Diskussion) 18:27, 8. Sep. 2014 (CEST)

Nicht erfasste Fehler

Eben noch einen Fehlertyp entdeckt: Leere Vorlagen. Vermutlich selten, aber nicht in der Liste erfasst:

  • {{DNB-Portal|TYP=Werke von|NAME=Henry Carey}}

Per Hand korrigiert.[1] --Kolja21 (Diskussion) 19:34, 9. Sep. 2014 (CEST)

Warum diese Liste?

Da immer mal wieder von empörten Autoren die Frage aufkommt, warum Tn's (nicht-individualisierte Datensätze) aus der Vorlage:DNB-Portal gestrichen werden, hier zwei aktuelle Korrekturen:

  1. Entitätenfehler Tn 100765661 für Franz Heger (Ethnologe)
    Der Ethnologe ist bereits 1931 verstorben, soll aber Autor des 2010 erschienen Werkes Technische Regeln Ölanlagen (2. Aufl.) sein.
  2. Entitätenfehler Tn 100782434 für Ernst Schaumann (Chemiker)
    Der Chemiker wurde 1943 geboren, hat aber angeblich als Autor an Bd. 7 des Deutschen Lesebuch für österreichische Mittelschulen mitgewirkt, das bereits 1932 erschienen ist.

Leider fallen nicht alle fehlerhaften Zuordnungen so leicht auf, und selbst wenn sich zum Zeitpunkt des Eintrags alle mit dem Tn verknüpften Werke auf die betreffende Person beziehen, kann sich die Zuordnung jeden Tag ändern. Tn's sind temporär vergebene Nummern, die fortlaufend teils gelöscht, teils in Weiterleitungen umgewandelt oder mit neuen noch nicht redaktionell bearbeiteten Werken verknüpft werden. (Zzt. lässt die DNB-Redaktion die meisten Nummern nach der Abarbeitung leer stehen; langfristig, wenn klar ist, dass keine Bibliothek und kein Archiv sie mehr nutzt, werden diese Tn's gelöscht.)

Gehen bibliographische Informationen verloren? Nein, die Tn's werden in die Vorlage:Normdaten übernommen und dadurch automatisch in den entsprechenden Wartungskategorien (Kategorie:Wikipedia:Normdaten-Wartung) aufgeführt (s. auch Liste WP:GND/F). --Kolja21 (Diskussion) 19:40, 4. Mai 2015 (CEST)