Benutzer Diskussion:Wurgl/Fehler GND

aus Wikipedia, der freien Enzyklopädie

[ohne Überschrift]

@Kolja21, Silewe: Ich hab wieder mal eine Liste gebastelt. Hier geht es darum, ob die GND-Nummern gültig sind oder nicht, bzw. ob ein Namenseintrag als Personen-GND eingetragen ist oder umgekehrt, oder ob z.B. eine GND eines Werks als Personen-GND eingetragen wurde. Der Dump der DNB ist vom 22. Februar, aber es scheint so, als ob etliche Nummern die mit "115" beginnen und 9 Stellen haben, noch nicht im dem Dump enthalten sind und daher als "unbekannte GND" benörgelt werden. Laut PICA sind die teilweise schon im Januar angelegt worden, das muss ich dann beim nächsten Dump beobachten und eventuell diese neuen Nummern irgendwie rausfiltern.

Und da stellt sich gleich eine Frage: Es gibt so einige wenige Einträge die sich auf ein Pseudonym beziehen, wie bei Ilona_Andrews. Soll so eine GND für ein Sammel-Pseudonym in der WP als Typ=k (Körperschaft) oder als Typ=p (Person) eingetragen werden (es gibt beide Fälle, siehe J.H._Praßl).

Es gibt ganz sicher noch so einiges, das nicht so ganz toll ist – einfach mal nörgeln. Die Erstellung der Liste dauert so 7-8 Stunden, ich werde die recht selten (1 x im Monat oder so) laufen lassen. Mal sehen, wie oft die DNB einen Dump liefert, eventuell auch nur jedesmal wenn die einen frischen Dump gekocht haben.

--Wurgl (Diskussion) 10:18, 12. Mär. 2018 (CET)

Danke für die Liste. Sie überschneidet sich vermutlich teilweise mit Benutzer:Gymel/GND-Probleme; eine Liste, die übersichtlich gegliedert, aber schon länger nicht mehr aktualisiert wurde. Zur Frage mit dem Sammel-Pseudonym: Ein Sammelpseudonym (pis) ist ein Pseudonym = GND, Tpy p. Genauso steht es auch in GND 1075213967. --Kolja21 (Diskussion) 16:08, 12. Mär. 2018 (CET)
In dem Dump sind die Typen ganz anders gezeichnet, momentan erkenne ich die Typen "DifferentiatedPerson", "RoyalOrMemberOfARoyalHouse", "Family", "CollectivePseudonym", "LiteraryOrLegendaryCharacter" und "Gods" als Personen-GND an. Ist aber gruselig! Der Dump hat ausgepackt 19GB, passt damit nicht mehr in das Memory meines Rechners und damit ist das durchsuchen doch eher langweilig :-( --Wurgl (Diskussion) 17:46, 12. Mär. 2018 (CET)

Beim nächsten Lauf filtere ich dann die neu angelegten (und noch nicht im Dump vorhandenen) raus. Sind halt so 500 Webzugriffe, das muss deren Server aushalten. --Wurgl (Diskussion) 09:39, 14. Mär. 2018 (CET)

Erweiterung?

@Kolja21: Den Dump kann ich ja für mehr verwenden, Beispiel:
<rdf:Description rdf:about="http://d-nb.info/gnd/277-X">
        <rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#CorporateBody"/>
        <gndo:gndIdentifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">277-X</gndo:gndIdentifier>
        <foaf:page rdf:resource="https://de.wikipedia.org/wiki/American_Heart_Association"/>
        <owl:sameAs rdf:resource="http://viaf.org/viaf/139377934"/>
        …
Da ist erstmal ein Link auf die Wikipedia, nämlich auf American Heart Association, dann ist die GND-Nummer GND 277-X und eine Viaf-Nummer 139377934. Im Artikel der Herz-Vereinigung sind keine Normdaten und genau das könnte ich als Hint zum ergänzen angeben. Was meinst du dazu? --Wurgl (Diskussion) 22:44, 14. Mär. 2018 (CET)

Klingt vielversprechend, aber auch nach viel Arbeit. Mich würde vor allem interessieren, die Kategorie:Wikipedia:Veraltete Normdaten‎ zu leeren, also jene Artikel aufzuspüren, in denen sowohl GKD wie SWD eintragen sind, eine der beiden Normdaten aber mittlerweile in eine Weiterleitung umgewandelt wurde. Gruß --Kolja21 (Diskussion) 22:56, 14. Mär. 2018 (CET)
Also wenn ich auf eine GKD- (oder SWD-)Nummer klicke, dann lande ich bei der angegebenen GND-Nummer? Meinst du solche? Bei 4 Stichproben war das nicht der Fall, die Nummern sind jedenfalls im Dump enthalten.
Ganz generell hab ich bei und in der WP GND-Nummern gefunden wo ich draufklicke und dann bei einer anderen Nummer lande. Die könnte ich natürlich auch melden, hab das aber wegen "keine Verbesserung" sein lassen.
Zurück zu meiner Idee: Ja, das mag Arbeit sein, aber da muss man wohl nicht viel denken. Die Zuordnung (und damit das Hirnschmalz) hat ja schon die DNB gemacht. Mehr als optische Kontrolle (vor allem bei der VIAF) ist da nicht notwendig. --Wurgl (Diskussion) 23:25, 14. Mär. 2018 (CET)
GND-Nummern, "wo ich draufklicke und dann bei einer anderen Nummer lande" = gehört zum Abschnitt Benutzer:Gymel/GND-Probleme#Veraltete Normdaten. Diese Weiterleitungen würden mich schon interessieren und sind auch vergleichsweise schnell abzuarbeiten. --Kolja21 (Diskussion) 23:35, 14. Mär. 2018 (CET)
Okay! Aber dauert so 3-5 Tage, in 4-5 Stunden bin ich mit dem filtern der noch nicht im Dump vorhandenen Nummern durch, die werd ich per Hand in die Liste einpflegen. PS: Deine Schule mit der Fehlermeldung ist im Online-Datensatz schon korrigiert (im Dump tatsächlich Typ "DifferentiatedPerson"). Lesen die mit, oder hast du das parallel zu Meldung korrigieren können? --Wurgl (Diskussion) 23:41, 14. Mär. 2018 (CET)
Du meinst Karl-Rehbein-Schule = GND 2015253-X? Da erhalte ich die Rückmeldung: "Sie dürfen diese Daten nicht korrigieren. Unser Servicedesk erteilt Ihnen gegebenenfalls die Befugnis." Der fehlerhafte Typ "Person (piz)" steht noch im Datensatz. --Kolja21 (Diskussion) 23:55, 14. Mär. 2018 (CET)
Aha! Nicht genau genug geguckt. Oben steht "Organisation" und unten noch "Person" :-) Okay, okay, *Aschenbecher überm Kopf auslehr* :-) --Wurgl (Diskussion) 23:59, 14. Mär. 2018 (CET)
Sieht ganz gut aus. Ich denke morgen am Vormittag kann ich per Hand die Ausgabe von Bot einpflegen und wenn ich nicht noch einen Sack Fehler eingebaut hab, dann dürften alle Punkte aus dem Abschnitt implementiert sein (zumindest so, wie ich es verstanden habe). Blöderweise läuft das Zeugs so 7-8 Stunden, daher geht es nicht schneller vorwärts. Die weiterleitenden GNDs hab ich ja heute schon reingemacht, da war im Script so alles fehlerfrei *schwer hoff*, jedenfalls war die Ausgabe okay. --Wurgl (Diskussion) 20:38, 16. Mär. 2018 (CET)

Änderung okay?

Bei Landkreis Franzburg-Barth war die Weiterleitung verkehrt herum. Das was als GND eingetragen war, leitete auf die eingetragene GKD-Nummer weiter. Spezial:Diff/175130118 --Wurgl (Diskussion) 10:36, 18. Mär. 2018 (CET)

erledigtErledigt Da hat jemand SWD und GKD verwechselt, aber das ist heute völlig egal, da es nur noch eine GND gibt. --Kolja21 (Diskussion) 18:39, 18. Mär. 2018 (CET)

Bei Organisation Ukrainischer Nationalisten gibt es unter GND 5056096-7 einen Eintrag für 1929-1940 (der war bisher verlinkt) und unter GND 106979600X einen Eintrag ab 1940. Hab das als REMARK dazugemurmelt. Okay? --Wurgl (Diskussion) 11:05, 18. Mär. 2018 (CET)

erledigtErledigt Kann man so machen, muss man aber nicht, da die Nachfolger bereist in GND 5056096-7 verlinkt sind. --Kolja21 (Diskussion) 18:45, 18. Mär. 2018 (CET)

Bei Heinrich Bresslau hab ich die Tn 186684754 rausgenommen. Da sind zwar 7 Werke, aber 5 sind von vor seiner Geburt und die restlichen 2 passen nicht zu einem Architekten. --Wurgl (Diskussion) 21:37, 19. Mär. 2018 (CET)

Bei der Person David Schindelmeißer ist die GND einer Körperschaft (Organisation / kiz) verlinkt. Tp oder Tn gibt es wohl nicht. Den lass ich dir, Kolja21 :-) --Wurgl (Diskussion) 21:52, 19. Mär. 2018 (CET)

Bei Tn 1051356792 ist am Namen Holger Krahmer ein Werk angehängt, dessen Bezug zu dem Namen mir nicht einleuchtet. Das Buch Fehlermeldung? --Wurgl (Diskussion) 22:47, 19. Mär. 2018 (CET)

Fehlende Fehler

1.) Tp eingetragen, trotzdem ein GND-Check eingetragen, siehe z.B. hier.
2.) Tn eingetragen, aber GND-Check-Angabe fehlt (das umgekehrte von obigem).
--Informationswiedergutmachung (Diskussion) 21:55, 18. Mär. 2018 (CET)
Ja okay. Ich hab mich auf den Abgleich des Dumps der DNB mit unseren Daten konzentriert. Aber ich kann das irgendwann nächste Woche implementieren.
Ich will (falls der Probelauf jetzt klappt) die Liste neu generieren. Wird dann so 15 Uhr fertig sein (Änderungen bis ca. 10 Uhr sind dann wohl berücksichtigt). Neu sollte der Hinweis auf dazu passende VIAF sein, falls bisher keine eingetragen ist. Muss man nicht doof rumsuchen wenn es keine gibt. --Wurgl (Diskussion) 22:14, 18. Mär. 2018 (CET)
3.) Eine Liste, bei der die leere ND-Vorlage im Artikel ist ({{Normdaten|TYP=p|GND=|VIAF=}}) fehlt auch noch. --Informationswiedergutmachung (Diskussion) 22:55, 18. Mär. 2018 (CET)
Die liefert bei Typ=p wenigstens den Link zum persondata-Tool. Wenn der Typ ein anderer ist, dann auf jeden Fall ja. --Wurgl (Diskussion) 23:07, 18. Mär. 2018 (CET)
Dafür ist die Vorlage aber nicht gedacht. Sie ist für die Verwendung von Normdaten gedacht, nicht als Ersatz für die Personensuche, die irgendwo Links unter Werkzeuge hingehört. Und wieso rede ich eigentlich mit dir? Schon wieder vorbei, ich arbeite die Liste ab und gut, mit dir reden muss ich dabei nicht. --23:13, 18. Mär. 2018 (CET)
@Wurgl: Danke für die gute Arbeit! --Kolja21 (Diskussion) 00:33, 19. Mär. 2018 (CET)

Service:

  • 1.) Suche 7.838 Treffer
  • 2.) Suche 539 Treffer (Nachtrag 23:40 Uhr: jetzt 420 Treffer)
  • 3.) Suche 5.108 Treffer

--Wurgl (Diskussion) 09:11, 19. Mär. 2018 (CET)

Nr. 2 erle(di)gt... --Informationswiedergutmachung (Diskussion) 22:35, 24. Mär. 2018 (CET)
Ich präzisiere Nr. 1: Tp eingetragen, keine Tn, aber GND-Check. Die 7.838 Treffer stimmen daher nicht. --Informationswiedergutmachung (Diskussion) 03:32, 26. Mär. 2018 (CEST)
Sollte dann so sein: Suche 272 Treffer --Wurgl (Diskussion) 06:56, 26. Mär. 2018 (CEST)

Was machen bei sowas?

VIAF 151431426 vs. VIAF 155742396 Wobei es mir nicht um die VIAF geht, sondern vor allem um die daran hängenden GND 10178700-5 und GND 3001188-7 bei Abdou-Moumouni-Universität Niamey. --Wurgl (Diskussion) 08:56, 23. Mär. 2018 (CET)

Vorgänger + Nachfolger = 1 Artikel in Wikipedia. Das kommt häufig vor. In der Regel trage ich die GND für den aktuellen Namen der Institution ein, also Abdou-Moumouni-Universität Niamey = "Université Abdou Moumouni", GND 10178700-5. --Kolja21 (Diskussion) 19:42, 23. Mär. 2018 (CET)

Wikipedia-Personensuche

@Johanna Strodt (WMDE): Hallo, folgendes: in der Vorlage:Normdaten ist auch die Wikipedia-Personensuche integriert. Die Vorlage wird oft leer in einen Personenartikel eingetragen, weil viele, zu viele, der irrigen Meiunung sind, jede Biografie bekäme Normdaten. Dem ist nicht so. Daher die Bitte, die Personensuche links bei Werkzeuge integrieren und sie dann dafür aus der ND-Vorlage streichen. Ob es auch inhaltlich erwünscht ist, wäre dann die nachfolgende Frage, aber erst einmal die Frage: ist das technisch möglich? MfG --Informationswiedergutmachung (Diskussion) 13:21, 25. Mär. 2018 (CEST)

Es geht, wenn ich es recht verstehe, um das Tool Wikipedia-Personensuche, d.h. ein Werkzeug, das nicht alle, aber einen Großteil der Artikel betrifft. --Kolja21 (Diskussion) 17:52, 25. Mär. 2018 (CEST)
@Informationswiedergutmachung: Technisch möglich ist das, ja. Das kann im MediaWiki-Namensraum von Admins gemacht werden. -- Viele Grüße, Johanna Strodt (WMDE) (Diskussion) 15:26, 26. Mär. 2018 (CEST)
@Doc Taxon, Flominator, Schniggendiller, Graphikus: (rein willkürliche Auswahl!) Dann mal die Frage an euch: kannst du das machen? Gibt es Einwände dagegen oder wo sollte man das besprechen? MfG --Informationswiedergutmachung (Diskussion) 15:31, 26. Mär. 2018 (CEST)
wenn es keine GND oder andere der IDs gibt, aber vielleicht später mal, ist doch der Link für die Personensuche genau am Platz der Vorlageneinbindung ideal. ... – Doc TaxonDisk.WikiMUCWikiliebe?! 21:27, 26. Mär. 2018 (CEST)
Aua, nein, eben nicht, weil die leere Vorlage:Normdaten nicht in den Artikel gehört nur für die Personensuche. Es bekommt nicht jeder bekommt nicht jeder Biografieartikel Normdaten. Bisher wird die leere Vorlage rein willkürlich in die Artikel gesetzt und das ist ein Fehler, weil es die Bearbeitung der ND stört. Und zwar massiv. --Informationswiedergutmachung (Diskussion) 21:41, 26. Mär. 2018 (CEST)
Und dann müßt man konsequenterweise alle Artikel, nicht nur die Biografieartikel mit der Vorlage versehen. Und das wäre echter Horror. 2 Mio. Artikel (abzüglich der BKS) mit Vorlageneinbindung? Das ist völlig überflüssig. --Informationswiedergutmachung (Diskussion) 21:46, 26. Mär. 2018 (CEST)
was genau meinst Du mit "Bearbeitung der ND", die da gestört werden soll? – Doc TaxonDisk.WikiMUCWikiliebe?! 00:18, 27. Mär. 2018 (CEST)

https://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:Wurgl/Fehler_GND&action=edit&section=5

Ich habe mal allen (!) Schauspielern die ND-Vorlage verpaßt, im Moment gibt es keine Schauspieler ohne ND-Vorlage, siehe hier. Schauspieler zählen zu den üblichen Verdächtigen, also Personen, die einen Eintrag in der DNB haben oder bekommen werden. Leere Vorlagen sind daher Mist. Weil keiner überprüft hat, ob sie nun welche haben oder nicht. Haben sie welche, fehlen die; haben sie keine fehlt dann das Kein GND-Personendatensatz. Letzte Überprüfung: 27. März 2018. (als Beispiel siehe Zbigniew Sawan)
Im Abschnitt Fehlende Fehler steht unter Punkt 3, dass es insgesamt 5.108 Treffer gibt. Ist mittlerweile auf gut 4.700 abgesunken, weil ich die bearbeite. Ich weiß nicht, wieviele Schauspieler und natürlich auch Autoren, aber auch haufenweise andere Personen dabei sind, die eine Tp haben, oder eine Tn, weil es noch nie einer geprüft hat. Ich räume in nächster Zeit diese Liste ab, aber das wird niemanden daran hindern, erneut leere ND-Vorlagen in die Artikel zu bringen und damit die Arbeit derer zu behindern, die die eigentliche Arbeit machen.
Bestes Beispiel: Jan Bluthardt. Am 20. März 2018. 14:56 angelegt, eine IP kopiert um 15:11 von irgendwo her die leere Vorlage rein (samt Kategorien). Wenn jemand, in dem Fall ich, also, siehe den ersten Link, jetzt nach Schauspielern sucht, die keine ND-Vorlage haben, ist er gelackt. Der Mann hat einen DNB-Eintrag. Die Vorlage gehört raus, übrigens auch aus der Wikipedia:Formatvorlage Biografie gelöscht bzw. kommentiert. --Informationswiedergutmachung (Diskussion) 13:31, 27. Mär. 2018 (CEST)
Übrigens ein schönes Beispiel für Wie macht man es nicht in Uwe Schröder (Jurist). Leere Vorlage, aber eine Wikikacka-Eintrag. Der übliche Stuß: zwei Personen mit selbem Namen und Geburtsjahr werden zusammengewürfelt. Es gab ja schon die irrsinnige Idee, sowas dann automatisch von Wikikacka in die Wikipedia übertragen zu lassen und das dann bei uns löschen? Ein gruseliger Gedanke, hier wäre dann der Fehler nie entdeckt worden, weil es keine Prüfung mehr gibt und in Wikikacka eh nicht, warum auch, er hat ja eine Tp... ein Smiley hält die Hand vor sein Gesicht(Facepalm)Vorlage:Smiley/Wartung/facepalm  --Informationswiedergutmachung (Diskussion) 14:00, 27. Mär. 2018 (CEST)
Hab mal bei Wikikaka die Windeln gewechselt, jetzt ist es dort weg. --Wurgl (Diskussion) 14:54, 27. Mär. 2018 (CEST)
Nächstes Beispiel: Dave Goldberg. Hat einen Eintrag bei VIAF und der LOC, keinen in der DNB. Der ist aber auch möglich, aber wie soll man das ändern, wenn die leere Vorlage im Artikel ist und der Artikel wegen der fehlenden Wartungskategorie eben nicht bei Kategorie:Wikipedia:GND fehlt auftaucht? --Informationswiedergutmachung (Diskussion) 14:14, 27. Mär. 2018 (CEST)
wenn die Vorlage leer eingefügt werden kann, diese Dich aber bei der nützlichen Aufgabe hindert, könnte man die Vorlage entsprechend so umbauen, dass bei leerer Einfügung oder leerem Parameter GND die Wartungskategorie dann zumindest ohne Datum befüllt wird, z.B. bei Kategorie:Wikipedia:GND fehlt (ohne Datum). Das geht. – Doc TaxonDisk.WikiMUCWikiliebe?! 16:46, 27. Mär. 2018 (CEST)
Und warum sollte ich Botarbeiten machen? Und warum sollte bei jedem Artikel, bei dem eine leere Vorlage drin ist, das Überprüfungs-Datum eingefügt werden? Auch das ist Botarbeit. Letzteres landet dann allerdings eh bei der entsprechenden Monatskategorie in Kategorie:Wikipedia:GND fehlt. Allerdings ungeprüft, ob die Person je Normdaten bekommt, bspw. die meisten Sportler werden nie einen Eintrag haben, auch die meisten ausländischen Politiker nicht. Die Kategorie hat jetzt schon 77.800 Einträge, die muss nicht weiter unkontrolliert geflutet werden. Die Personensuche wäre links am besten aufgehoben, dann hat sie JEDER Personenartikel. Was die Wikipedia am allerallerallerwenigsten gebrauchen kann ist im übrigen eine weitere Wartungskat. --Informationswiedergutmachung (Diskussion) 17:12, 27. Mär. 2018 (CEST)
Lass Botarbeiten doch Bots machen. Aber Du hast schon recht, nicht jeder bekommt einen Eintrag. Wir dürfen aber LCCN und VIAF nicht vergessen. Ausländische Politiker hätten diese eher als unsere GND und sollten diese Vorlage dann auch erhalten. Sportler sind deutlich seltener, schon klar. Man kann die Personensuche aber schon bei Werkzeuge reinbasteln, es muss halt nur erkenntlich sein, welcher Artikel denn nun eine Person darstellt, um dieses Werkzeug in der Werkzeugliste anzuzeigen oder eben nicht. Dazu solltest Du Dich bei Wikipedia:Technik/Werkstatt melden, dass die das da reinzimmern oder Dir verklickern, wie das geht. Wenn Du einen Bot brauchst, melde Dich einfach noch mal, – Doc TaxonDisk.WikiMUCWikiliebe?! 21:57, 27. Mär. 2018 (CEST)
@Informationswiedergutmachung: Soll ich die leeren Vorlagen per se entfernen? – Doc TaxonDisk.WikiMUCWikiliebe?! 01:35, 29. Mär. 2018 (CEST)
@Doc Taxon: Ne, besser nicht, ich guck die alle selber durch, es sind zu viele dabei, die vermutlich Einträge in der VIAF, der LOC oder der DNB haben. Aber man könnte einen Bot basteln, der zukünftige leere ND löscht, verbunden mit dem Hinweis an den Benutzer, der das eingestellt hat, nur noch Vorlagen mit mindestens einem Normdatum zu verwenden. Willst du das übernehmen? Kannst dich ja an Benutzer:CamelBot/maintenance list/ASIN orientieren. So als Beispiel Benutzer Diskussion:Diego de Tenerife#Hinweis auf Katalog-Nummern von Amazon. MfG --Informationswiedergutmachung (Diskussion) 11:08, 29. Mär. 2018 (CEST)
@Informationswiedergutmachung: Zukünftig heißt also, erst wenn Du sie alle einmal durchgeguckt hast? Dann kontaktiere mich einfach, wenn es so weit ist. – Doc TaxonDisk.WikiMUCWikiliebe?! 16:47, 29. Mär. 2018 (CEST)
Warum kann man das nicht sofort machen? Nur für Neuanlagen ab z.B. eben heute, ist das ein technisches Problem? --Informationswiedergutmachung (Diskussion) 16:59, 29. Mär. 2018 (CEST)
@Informationswiedergutmachung: Ach für Neuanlagen, ja gut, kann ich machen. Muss ich aber erst programmieren. Kannst Du dafür einen guten Benutzerhinweis entwickeln? Du bist mehr im Thema drinnen und könntest dem Hinweis vielleicht noch Tipps oder ähnliches beisteuern. Wäre gut, wenn Du helfen könntest. – Doc TaxonDisk.WikiMUCWikiliebe?! 17:14, 29. Mär. 2018 (CEST)
Ja, ich laß mir die Tage was einfallen, es dürfen aber auch gerne andere helfen. So für den Anfang: Hey, du, laß mal die Pfoten von den ND, du Pappnase!? <scnr> --Informationswiedergutmachung (Diskussion)

== Hinweis auf die richtige Verwendung der Normdaten-Vorlage == Hallo [Benutzer]!
Mir ist aufgefallen, dass Du im Artikel Artikel die Vorlage {{Normdaten}} unausgefüllt eingefügt hast. Da dies zu einer aufwändigen Korrekturarbeit führt, wurde diese Vorlage automatisch entfernt.
Da aber Normdaten existieren könnten, bitte ich Dich, die Vorlage von vornherein korrekt auszufüllen oder sie ganz wegzulassen. Auf der Seite Hilfe:Normdaten ist es sehr gut erklärt, wie man die Vorlage ausfüllt, und wo man die Daten herbekommt.
[Signatur und so]

Hallo @Informationswiedergutmachung! Ich hab mal einen kleinen noch ziemlich nackigen Hinweis oben ausgebrütet. Was meinst Du, wie kann man das noch verbessern? – Doc TaxonDisk.WikiMUCWikiliebe?! 20:01, 29. Mär. 2018 (CEST)

Das reicht doch völlig, aber eins hätte ich noch gerne: das das auf Wikipedia Diskussion:Normdaten übertragen wird, damit das auch von anderen gesehen und letztendlich gutgeheißen wird. Das sollte keine Entscheidung zwischen dir und mir sein. Und das hier ist mehr oder weniger Wurgls private Unterseite. Ich bitte daher ausdrücklich dich, das auf die ND-Disk zu übertragen, weil es zeigt, dass das nicht nur meine Idee ist, sondern auch deine. Das erhöht die Akzeptanz. MfG --Informationswiedergutmachung (Diskussion) 20:05, 29. Mär. 2018 (CEST)
erledigtErledigt

Wegen Abgleich unserer Personendaten mit den bei der DNB hinterlegten Links auf Filmportal.de

Ich hab der DNB und dem Filmportal eine Nörgelmail bzgl. der kaputten Links geschickt. Laut Dump sind 173.317 Personen verlinkt und bei allen fehlt der Name im Link, so dass alle diese Links im 404er-Nirvana enden. Bei uns sind übrigens (laut Datenbank-Query) 6.266 Personen mit dem Filmportal verlinkt, wobei mir nicht ganz klar ist, ob die deWP-Datenbank auch bei solchen Artikeln ein Record hat, wo der Filmportal-Link aus Wikidata kommt. --Wurgl (Diskussion) 12:29, 28. Mär. 2018 (CEST)

Darüber kann Queryzo Auskunft geben. Siehe auch: Wikipedia:Redaktion Film und Fernsehen#Vorlage:Filmportal. Besserung ist jedoch wie gesagt in Sicht.? Guter Witz, Queryzo... --Informationswiedergutmachung (Diskussion) 14:04, 28. Mär. 2018 (CEST)
Nach Ostern soll alles wieder funktionieren. Hoffen wirs. –Queryzo ?! Red-WikiPill.png Blue-WikiPill.png 14:10, 28. Mär. 2018 (CEST)
Aha! Okay. Doppelt hält besser, ich hab übrigens in meiner Nörgelmail nichts von Wiki-Irgendwas erwähnt, nur das Zusammenspiel von DNB und Filmportal. --Wurgl (Diskussion) 14:17, 28. Mär. 2018 (CEST)
Okay. Hätte ich mir sparen können. Gibt (momentan) keinen Artikel mit Filmportal und ohne GND-Nummer. --Wurgl (Diskussion) 08:00, 29. Mär. 2018 (CEST)
Danke, das beantwortet meine Frage, die ich gerade zu dem Thema stellen wollte. Das Filmportal hat vor einiger Zeit seine Artikel mit der GND abgeglichen, aber ein paar Personen übersehen. --Kolja21 (Diskussion) 17:32, 29. Mär. 2018 (CEST)
Wenn man es richtig macht, dann findet man schon ein paar. 75 Stück, davon sicher ein paar falsche. Falsche kommen raus, wenn nicht zum Lemma passende Links auf das Filmportal im Artikel sind (und der Filmportal-Artikel nicht auch im richtigen Artikel verlinkt ist). Hier mal ein echter Treffer als Beispiel:
  1. GND 106200244X und VIAF 311677513 bei Tino Hillebrand Filmportal: http://www.filmportal.de/person/tilo-hillebrand_9bc0e6ed92e14bd5b057740020047d17
Der Testlauf hat ca. 200 ausgeworfen. Da sind noch solche darunter, die zwei DNB-Datensätze enthalten und derjenige ohne Filmportal-Link ist eingetragen. --Wurgl (Diskussion) 20:24, 30. Mär. 2018 (CEST)
Ich könnte ja Vorschläge für Fehlermeldungen an die DNB daraus generieren … natürlich gefiltert um die schon gemeldeten, aber ich glaub, dass die DNB dann am Rad dreht. --Wurgl (Diskussion) 19:49, 31. Mär. 2018 (CEST)

Neuer Abschnitt "GND könnte ergänzt werden"

Ich glaub es nicht, aber es gibt tatsächlich ca. 800 Fälle, wo einem WP-Artikel eine VIAF zugeordnet ist, aber keine GND-Nummer (weder Tn, noch Tp), im GND-Dump aber diese VIAF als Verweis bei einer GND enthalten ist. Beispiele: Tp: Jens Schroth GND: Forum Gut Gödelitz Tn: James Elton. Beim nächsten Update der Liste sind die dann auch enthalten. --Wurgl (Diskussion) 09:24, 30. Mär. 2018 (CEST)

ein lächelnder Smiley  doch ich kann mir das schon erklären. Die tollen Skripte von Schnark gibt es erst seit 2011. Alles was vorher eingefügt wurde, musste mühsam zu Fuß zusammengesucht und eingetragen werden. Dazu hatte auch ich damals nicht immer Lust... Ich meine mich auch zu erinnern, dass die Normdatenvorlage erst 2011 oder 2012 die Erweiterung für die Wartungskategorien erhalten hat. Es kann also schon sein, dass wir im alten Artikelbestand noch so einige Ungereimtheiten finden könnten. Umso feiner ist es, dass Du diese Ungereimtheiten aufspüren und uns zur Wartung zur Verfügung stellen kannst. Danke deshalb und Frohe Ostern, --Silke (Diskussion) 20:50, 31. Mär. 2018 (CEST)
Gibt ja heute noch Leute, die immer noch per Hand einfügen… Sieht man an der führenden Null bei der letzten Zahlengruppe der LCCN. Und die Ungereimtheiten/Fehlerchen sind bei einem so großen Datenbestand ganz normal, da denk ich nicht viel drüber nach. Nur wie ich die 30.000 und die 80.000 (vordere Seite, jeweils Ende der Abschnitte) abackere, weiß ich noch nicht. Die 800 Fehlenden dieser Gruppe sind ein Klacks, die sind nach ein paar Sitzungen erledigt. --Wurgl (Diskussion) 12:19, 1. Apr. 2018 (CEST)
Guck mal hier bei der DNB Da war wohl irgendwann man die Musikgruppe Kraftwerk mit dem Kraftwerk in Wilhelmshaven in einem gemeinsamen Datensatz … Bei einem großen Datenbestand ist sowas ganz normal. --Wurgl (Diskussion) 13:59, 1. Apr. 2018 (CEST)

Parameter der Normdaten

Hab mal geguckt was für Parameter ist so finde:

Parametername Okay
2 Falsch
3 Falsch
4 Falsch
7 Falsch
BNF Wikidata
GKD Okay / Veraltet
GND Okay
GND1117479935 Falsch
GNDCheck Okay
GNDfehlt Okay
GNDName Okay
LCCN Okay
LCCNCheck Nicht vergeben
LCCNfehlt Nicht vergeben
LCN Falsch
LCNN Falsch
LLCN Falsch
NDL Okay
REMARK Okay
SELIBR Wikidata
SWD Okay / Veraltet
TYP Okay
ULAN Wikidata
VIAD Falsch
VIAF Okay
VIAFfehlt Nicht vergeben

@Kolja21: Kannst du die Fragezeichen bitte aufklären? Diese sind mir unklar. Ich erweitere dann diese Liste entsprechend. --Wurgl (Diskussion) 21:49, 9. Apr. 2018 (CEST)

Gerne --Kolja21 (Diskussion) 21:54, 9. Apr. 2018 (CEST)
Interessant wären auch die Fälle, in denen eine SWD oder GKD eingetragen ist, aber keine GND. Ich habe dunkel in Erinnerung, dass sie bereits abgearbeitet wurden. --Kolja21 (Diskussion) 21:57, 9. Apr. 2018 (CEST)
Also in erster Linie will ich mal die falschen Parameter rausfinden. Verstehe ich das richtig, dass "Wikidata" & "Nicht vergeben" okay sind, also nicht benörgeln? Die SWD/GKD ohne GND mach ich gerne. --Wurgl (Diskussion) 22:00, 9. Apr. 2018 (CEST)
Wikidata = diese Normdaten gehören nicht hierher, sondern nach Wikidata; Nicht vergeben = falsch. Eigentlich sollten diese Fehler bereits in der Liste "fehlerhafte Parameter der Vorlage:Normdaten" erfasst sein. --Kolja21 (Diskussion) 22:45, 9. Apr. 2018 (CEST)
Passt! Ich finde 18 Stück, die beiden mit "Parameter Remark" hab ich nicht. Dann mach ich vorne nur einen Hinweis auf die Liste … --Wurgl (Diskussion) 22:53, 9. Apr. 2018 (CEST)
Ich mach das anders. Ich lasse den Bot einen Abschnitt hier in dieser aktualisieren. Ist bequemer als eine nicht klickbare Textdatei.

Vorlage DNB-Portal

Anlässlich dieser Änderung von Informationswiedergutmachung und der wunderbaren Erklärung von Silke werde ich nicht individualisierte DNB-Nummern (aka Tn's) in dieser Vorlage ebenfalls benörgeln. Ebenso wenn die GND darinnen eine Weiterleitung auf eine andere ist. Gibt es noch irgendwelche Fälle? Bestimmte Kombinationen der Inhalte dieser Vorlage mit den Normdaten? (Dunkel erinnere ich mich da an was.) --Wurgl (Diskussion) 21:21, 12. Apr. 2018 (CEST)

Danke für die Blumen, aber ich hatte mit Kolja21 auch einen geduldigen Lehrer. Hier hat er es auch einmal mit Beispielen erklärt. Benutzer_Diskussion:Gymel/DNB-Portal#Nicht_erfasste_Fehler wäre eventuell noch einmal ein neuer Ansatz, oder ganz unbekannte Nummern? @Kolja21: fällt bestimmt noch etwas ein. Viele Grüße --Silke (Diskussion) 21:49, 12. Apr. 2018 (CEST)
Mensch, das ist ja gleich ein ganzer Blumenstrauß ;) Gebe die Komplimente gerne zurück und bin mit den vorhandenen Wartungslisten vollauf zufrieden = beschäftigt. Nächtliche Grüße --Kolja21 (Diskussion) 23:51, 12. Apr. 2018 (CEST)
Tolle Sachen findet man da: (Direkter Link in den Quellcode-Editor) Das ist eine von insgesamt 32 Seiten mit seltsamen Parametern in der Vorlage. --Wurgl (Diskussion) 15:37, 18. Apr. 2018 (CEST)
Da würde mich mehr interessieren, ob jeder, der auf Wikisource in der ADB vorkommt und hier einen Artikel hat, auch bei Wikisource verlinkt ist und hier die Vorlage:ADB hat. Gilt auch für das BLKÖ. --Informationswiedergutmachung (Diskussion) 15:43, 18. Apr. 2018 (CEST)
@Kolja21: Ich bin in den letzten Zügen beim Basteln der Liste. Hab das Zeugs von PHP in C++ umgeschrieben, jetzt dauert der Schmarrn nicht 9 Stunden, sondern ist in grob einer Stunde durch. Läuft zwar nicht auf den Toolservern, aber erstmal bei mir zu Hause. Deswegen die Verzögerung. Bei der Vorlage DNB-Portal sind ja ebenfalls GND-Ids drinnen. Und dort gibt es im Dump für Sinntal bzw. GND 4242473-2 so eine Zeile:
<gndo:oldAuthorityNumber rdf:datatype="http://www.w3.org/2001/XMLSchema#string">(DE-588b)2027438-5</gndo:oldAuthorityNumber>
Beim Klick auf 2027438-5 im Katalog der Deutschen Nationalbibliothek kommt nix besonders hilfreiches raus. Besser wäre ein Klick auf 042424739 im Katalog der Deutschen Nationalbibliothek
Aber wie komme ich zu der Nummer 042424739? Im Dump kommen so Nummern mit führenden Nullen nicht vor? Wenn kein Minus-Zeichen in der GND-Id ist, dann scheint eine Ersetzung zu funktionieren und damit wäre das hilfreich. Wenn aber so ein Minus drinnen ist, dann weiß ich nicht. --Wurgl (Diskussion) 15:50, 9. Mai 2018 (CEST)
Sorry, ich verstehe das Problem nicht, da ich alles händisch mache. Gebe ich die dublette GND 2027438-5 (ehemals GKD) ein, sehe ich, dass der Datensatz gelöscht bzw. mit der ehemaligen SWD 4242473-2 zusammengeführt wurde. Das entspricht der Angabe "oldAuthorityNumber" = Datensatz nicht mehr verwenden. --Kolja21 (Diskussion) 02:17, 12. Mai 2018 (CEST)
Ich kann zwei Dinge nicht machen: 1.) Einen Vorschlag womit die Nummer zu ersetzen ist und 2.) vorhandene Einträge auf sinnvollen Link überprüfen. Sinnvoll im Sinne von: Liefert tatsächlich Publikationen und nicht nur einen Normdatensatz oder wegen Copy-Paste-Lose gar nichts?. – Okay, ich kann schon, aber nur mit HTTP-Zugriffen und das sind sehr viele, beim Überprüfen auf Sinnhaftigkeit wären das über 100.000 Zugriffe (ca. 104.000 mal ist die Vorlage DNB-Portal eingebunden), das ginge schon in Richtung DDoS und sowas will ich unbedingt vermeiden. --Wurgl (Diskussion) 13:03, 12. Mai 2018 (CEST)
APPER hat mir eine Mail von der DNB weitergeleitet. Der Inhalt ist sinngemäß auf Vorlage_Diskussion:DNB-Portal --Wurgl (Diskussion) 22:35, 21. Mai 2018 (CEST)

Wo hol ich da "Sachbegriff" raus?

Hallo @Kolja21: Es geht um den Artikel: Schwarze Hundert Dort sind die Normdaten vom TYP=s / Sachbegriff eingetragen. Bei der GND 4394586-7 lese ich "Sachbegriff Schwarze Hundertschaften" und weiter unten dann "Typ Personengruppe (siu)".

Im Dump-File sieht das so aus:

<rdf:Description rdf:about="http://d-nb.info/gnd/4394586-7">
       <rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#GroupOfPersons"/>
       <gndo:gndIdentifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">4394586-7</gndo:gndIdentifier>
       <gndo:oldAuthorityNumber rdf:datatype="http://www.w3.org/2001/XMLSchema#string">(DE-588c)4394586-7</gndo:oldAuthorityNumber>
       <gndo:relatedDdcWithDegreeOfDeterminacy2 rdf:resource="http://dewey.info/class/363.3250947090/"/>
       <gndo:relatedDdcWithDegreeOfDeterminacy2 rdf:resource="http://dewey.info/class/947.083/"/>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černye sotni</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černaja sotnja</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černosotency</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Schwarze Hundert</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Die @Schwarzen Hundert</gndo:variantNameForTheSubjectHeading>
       <gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Schwarze Hundertschaften</gndo:preferredNameForTheSubjectHeading>
       <gndo:gndSubjectCategory rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#16.5"/>
       <gndo:geographicAreaCode rdf:resource="http://d-nb.info/standards/vocab/gnd/geographic-area-code#XA-RU"/>
       <gndo:definition xml:lang="de">Rechtsradikale Terrorgruppen in Rußland, 1905-ca.1914</gndo:definition>
</rdf:Description>

Der einzige Hinweis auf den Typ ist GroupOfPersons und das würde ich auf entweder auf TYP=p oder TYP=k mappen, aber nicht auf einen Sachbegriff. Diese Links auf dewey.info liefern bei mir nichts, sind aber hier en:List of Dewey Decimal classes erklärt. 363 bedeutet Russland und 947 soziale Probleme, hilft auch nicht richtig weiter. Hast du da eine Idee oder einen Ansprechpartner? --Wurgl (Diskussion) 19:01, 22. Apr. 2018 (CEST)

Der GND-Typ siu ist zwar ungewöhnlich, da man bei Personengruppe, wie du schreibst, an Typ p (z.B. Familie) oder k (z.B. Musikgruppe) denkt, aber eindeutig definiert:
Label (English) Group of persons
MARC 21 Equivalent 079 $v=siu
Has superclass Subject heading
Insofern müssen wir damit leben. Gruß --Kolja21 (Diskussion) 22:07, 22. Apr. 2018 (CEST)
Das ist teilweise sowas von verwirrend! Diese GND 7546544-9 ist was? Eingetragen ist bei Dyna-Soar Sachbegriff. Aber unten steht "Projekt (kip)", laut Dump das hier: https://d-nb.info/standards/elementset/gnd#ProjectOrProgram --Wurgl (Diskussion) 22:54, 22. Apr. 2018 (CEST)
In diesem Fall ist es schlicht ein Fehler: Typ kip = Köperschaft. Siehe Benutzer:Gymel/GND-Probleme#Kommentierte Altfälle / Fehler der GND-Redaktion. --Kolja21 (Diskussion) 00:39, 23. Apr. 2018 (CEST)

Neue Liste [2018]

@Kolja21: Ich schieb mal eine kleine Liste hoch. Klein, weil erstmal gucken was alles nicht so ganz toll richtig ist. So in 10 Minuten ist die fertig. Bitte um Kritik. --Wurgl (Diskussion) 15:51, 15. Mai 2018 (CEST)

+1. Sieht gut (= hilfreich) aus! --Kolja21 (Diskussion) 16:15, 15. Mai 2018 (CEST)
Bei dem Teil mit dem Abgleich vom Parameter TYP mit den bei der DNB hinterlegten Typen bin ich nicht ganz sicher. Kann sein, dass da noch Fehlerchen drinnen sind, hab mir zwar die Augen wundgeguckt, aber wer weiß. Übrigens: Wenn bei der DNB zwei Typen wie Geographikum und Körperschaft hinterlegt ist (gibt tatsächlich so Fälle), dann ist TYP=g genauso okay wie TYP=k. --Wurgl (Diskussion) 19:14, 15. Mai 2018 (CEST)

Gemurmel bei der GKD:

Ist ja richtig. Aber die dort eingetragene GND ist ein Geographikum. Die VIAF wiederum bezieht sich auch die GKD. Wie löst man das auf? REMARK=GND für das Schloss GND 4289435-9 und die GKD ins Feld GND verschieben? --Wurgl (Diskussion) 23:19, 15. Mai 2018 (CEST)

Das sind zwei paar Schuh: Das Schloss als Bauwerk (GND 4289435-9, Typ g) und GND 2149346-7 (Typ k) für die Forschungsstätte und das Novalis-Museum. --Kolja21 (Diskussion) 01:41, 16. Mai 2018 (CEST)
Ja eben demwegenhalb! Die GKD wird niemals nie nicht mit der GND "vereinigt". Aber du hast das ja genauso gelöst. --Wurgl (Diskussion) 08:38, 16. Mai 2018 (CEST)

Parameter VIAF

Hallo Wurgl, ich bin gerade beim Abschnitt "Parameter GKD". Die Korrektur von GKD in GND ist einfach, aber müssen wir den Parameter VIAF einzeln von Hand hinzufügen? Imho können wir die Arbeit einem Bot überlassen, da die Zuordung GND -> VIAF eindeutig ist. Gruß --Kolja21 (Diskussion) 15:02, 16. Mai 2018 (CEST)

Ich schrubte ja, dass ich das in C++ mit Qt geschrieben habe. Nicht ohne Hintergedanken. Und der Hintergedanke war eben ein interaktives Dingens bei dem ich mit gerötetem Auge die Zuordnung überprüfe und dann meinen Sanktus gebe, die eigentliche Änderung aber von jenem Dingens übernommen wird. Also sowas wie ein Halbbot. Bot mag ich nicht gar so, manchmal passen die Zuordnungen nicht, speziell wenn es Nachfolgerecords gibt. Da passt dann zwar die Zuordnung von der GND zu uns, aber der umgekehrte Weg sollte zum Nachfolger gehen. Daher ist das gerötete Auge wohl notwendig.
Die über 100.000 Viafs und die 80.000 GNDs die möglich sind, sind jedenfalls von uns paar nicht in endlicher Zeit zu schaffen – vielleicht mit 100+ Ameisen, die Tag für Tag am ackern sind. --Wurgl (Diskussion) 15:43, 16. Mai 2018 (CEST)
So, die heutigen Normdatenergänzungen sind mit meinem selbstgeschriebenen Tool gemacht. Im Prinzip öffnet das drei Fenster mit DNB-Datensatz, VIAF-Datensatz und dem Wikipedia-Fenster, ich kontrolliere per Auge ob der DNB-Datensatz zum Wikipedia-Artikel passt und klick dann auf Okay. Das Zusammenkramen der Normdaten-Ids macht das Tool. Kannst ja gucken, ob ich irgendwo was zerstört hab oder falsch gemacht hab. Ich hab so 30 Unterschiede angeguckt und nix böses gefunden. Die übriggebliebenen auf der Vorderseite müssen vorerst per Hand zugeordnet werden oder (bei machen) gar nix. Bei denen passt irgendwas nicht, entweder falsche Zuordnung oder unklare Sache. --Wurgl (Diskussion) 19:24, 1. Jul. 2018 (CEST)

Vorlage Tp und Tn im ANR

Ich frage mich, ob diese beiden Vorlagen überhaupt in den ANR reinsollen? Laut Beschreibung der Vorlagen wohl nicht, die Vorlage GND sollte das eigentlich abdecken. 63 Vorkommen (in 20 Artikeln) von Tp und ein Vorkommen von Tn zähle ich außerhalb der Feldes REMARK der Vorlage Normdaten (okay, jetzt noch 61 bzw. 18). @Kolja21, Silewe: Was meint ihr? --Wurgl (Diskussion) 15:46, 28. Mai 2018 (CEST)

Hallo Wurgl, die Tns sollten auf jeden Fall raus, da sie keine zitierfähige Quelle sind. (Leider gibt es einige User, die alles, was sie unter einem Namen finden, ungeprüft der gleichen Person zuordnen. Mein Highlight war ein Artikel, in dem die beschriebene Person im Abstand von 30, 40 Jahren in zwei unterschiedlichen Fächern promoviert wurde. Der "Beweis" dafür war ein Tn.) Die Umwandlung der Vorlage {{Tp}} in {{GND}} ist dagegen nur kosmetischer Natur. --Kolja21 (Diskussion) 15:56, 28. Mai 2018 (CEST)
Der einsame Tn ist vorne gelistet. --Wurgl (Diskussion) 16:41, 28. Mai 2018 (CEST)

Kaputte Links auf diversen Seiten

Wenn jemand eine Idee hat, wie man automatisiert diese Links wieder zum Leben erwecken kann, dann bitte her damit. In den Artikeln sind die noch mit dem Host portal.dn-b.de und teilweise vom IABot als defekt markiert. Wenn man die im Artikel sucht, dann Browsersuche nach "atr%253D". --Wurgl (Diskussion) 15:40, 5. Jun. 2018 (CEST)

Hmm
Kaputt: https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=atr%253D133512428%2526any&currentPosition=16
Gemeint sein könnte: https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=133512428%26any&currentPosition=23
Nur aus 16 wird auf magische Art eine 23. Das funktioniert nicht automatisch. Eigentlich bräuchte man ein Aufpasserscript welches so Links mit currentPosition nicht zulässt, wenn die DNB ein Werk zusätzlich aufnimmt, dann gibt es einen Treffer mehr und diese Position verschiebt sich, entsprechend geht der Link dann irgendwohin. --Wurgl (Diskussion) 15:47, 5. Jun. 2018 (CEST)
Mit dem Parameter currentPosition sind dann nochmals ca. 1405 Links zu finden … --Wurgl (Diskussion) 15:58, 5. Jun. 2018 (CEST)
Um meine Überlegung nachvollziehbar zu machen ein Beispiel: Im Artikel Über_Friedrich_den_Großen_und_meine_Unterredung_mit_ihm_kurz_vor_seinem_Tode ist der Link https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=Zimmermann,+and+Johann+and+Georg,+and+%C3%BCber%26any&currentPosition=17 zu finden Der Link geht nach Zimmermann, Johann Georg: Ueber die Einsamkeit gemeint ist aber wohl Treffer 20 (einfach am Ende vom Link die 17 gegen 20 tauschen), also Fragmente über Friedrich den Grossen zur Geschichte seines Lebens, seiner Regierung, und seines Charakters / von [Johann Georg] von Zimmermann --Wurgl (Diskussion) 19:02, 5. Jun. 2018 (CEST)
Vermutlich ist viel Schrott dabei. Ein Eintrag unter Weblinks wie:
gehört in die Rubrik: 'Ich habe da irgendwas im Netz gefunden, aber ich weiß weder, wie man zitiert, noch kenne ich mich mit Vorlagen aus.' --Kolja21 (Diskussion) 21:51, 5. Jun. 2018 (CEST)
Okay, dann motz ich auch mal: Nach 9 Jahren immer noch keine Ahnung von Vorlagen? --Wurgl (Diskussion) 21:57, 5. Jun. 2018 (CEST)
Das wäre nicht schlimm, wenn der betreffende User wenigsten den ersten Satz seiner Fundstelle gelesen hätte: "Link zu diesem Datensatz: http://d-nb.info/1003735983" Wer dann trotzdem die URL mit Angaben wie "currentPosition=17" in den Artikel reinkopiert, dem ist nicht zuzutrauen, dass er einen lexikontauglichen Text verfassen kann. Im Grunde sollte ein Bot alle betreffenden Artikel in der QS melden. --Kolja21 (Diskussion) 22:16, 5. Jun. 2018 (CEST)
Guck mal hier: Wikipedia_Diskussion:Technik/Werkstatt#Linkfix_–_Ideensuche Ich hoffe ja, dass der überwiegende Teil der Suchergebnisse sich nicht verändert hat, bzw. dass ich da einen sinnvollen Ersatz finde. Dann geht das recht schnell. Ein paar werden übrigbleiben. Aber sowas nervt einfach. --Wurgl (Diskussion) 22:26, 5. Jun. 2018 (CEST)
Also ich hab jetzt mal ausgewertet. Es sind 135Die Zahl war falsch58 Links die keinen Treffer liefern, 1189 wo ich aus dem Kontext nicht sagen kann, was verlinkt werden sollte (mehrere Treffer mit vollkommener Übereinstimmung bzw. kein Treffer mit solcher) und 225203 bei denen der gemeinte Datensatz eindeutig aus dem Kontext herausgepfriemelt werden kann. Mit Bot kann ich direkte Links ersetzen, aber nicht die 4 denkbaren Vorlagen Tn, Tp, GND und DNB und das eben leider nur bei 225 Fällen. --Wurgl (Diskussion) 17:13, 9. Jun. 2018 (CEST)


2 Beispiele für Fälle wo der Link im Artikel keinen Treffer liefert. Wenn es Ideen gibt, was das für eine Nummer gewesen sein könnte und wie ich diese in eine funktionierende umwursteln kann, dann nur her damit.(das == hab ich am Zeilenende weggemacht damit hier nicht noch mehr Abschnitte entstehen)
== Rudolf_Schwarzkogler

== Alexander_Saftig


2 Beispiele für Fälle wo das Script nicht entscheiden kann, welcher Datensatz genommen werden soll.
== Jasper_Hanebuth

== Atanas_Kareev


2 Beispiele für Fälle wo die Treffer wohl eindeutig sind.
== Terpene

== Kochbuch

Ein bissl hasse ich die DNB

Jetzt hab ich ganz toll ein Programm um diese Datei GND.rdf auszuwerten, nun gibt es unter https://data.dnb.de/opendata/ eine Datei GND.hdt.gz Argh! --Wurgl (Diskussion) 20:22, 1. Jul. 2018 (CEST)

Aarg! Die haben die Datei wohl gesplittet:
  • Tbgesamt1806gnd.rdf.gz 2018-06-28 11:24 132M 1491029 Datensaetze / 14574825 Tripel / GND, Entitaeten Koerperschaft, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tfgesamt1806gnd.rdf.gz 2018-06-28 11:25 60M 794129 Datensaetze / 6667707 Tripel / GND, Entitaeten Kongress, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tggesamt1806gnd.rdf.gz 2018-06-28 11:26 25M 302893 Datensaetze / 3150306 Tripel / GND, Entitaeten Geografikum, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tngesamt1806gnd.rdf.gz 2018-06-28 11:30 300M 7037189 Datensaetze / 54403264 Tripel / GND, Entitaeten Personenname (nicht indiv.), Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tpgesamt1806gnd.rdf.gz 2018-06-28 11:43 620M 4869852 Datensaetze / 83576136 Tripel / GND, Entitaeten Person (indiv.), Format RDF (RDF/XML) (Stand: 14:20 Uhr UTC)
  • Tsgesamt1806gnd.rdf.gz 2018-06-28 11:47 14M 209892 Datensaetze / 1833398 Tripel / GND, Entitaeten Sachbegriff, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tugesamt1806gnd.rdf.gz 2018-06-28 11:47 23M 348957 Datensaetze / 304730 Tripel / GND, Entitaeten Werk, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
Okay, die Werke brauch ich wohl eher nicht. --Wurgl (Diskussion) 20:29, 1. Jul. 2018 (CEST)

REMARK-Feld

@Wurgl: Mit dem Abschnitt "Ersetzen einer weiterleitenden GND" bin ich durch. Vermutlich gibt es im Feld REMARK noch etliche Hinweise auf Dubletten, die bislang nicht über WP:GND/F gemeldet wurden. Sind diese Fälle irgendwo erfasst? (Hätten wir geahnt, dass eines Tages so viele Archive und Bibliotheken ihre Normdaten größtenteils ungeprüft zusammenwerfen, hätte man in der Vorlage:Normdaten analog zu GNDName einen Parameter GNDDublette einfügen können.) --Kolja21 (Diskussion) 18:50, 22. Aug. 2018 (CEST)

Ich mach mal mit der Ergänzung der VIAF etc. weiter, hab noch ca. 2000 Stück bei der einen Suche und 400 bei der zweiten (die Suchen sind auf meiner Benutzerseite verlinkt). Wenn ich damit durch bin, dann guck ich mal, wie ich diese Liste erneuere, wobei ich so manche der Kommentare erhalten will. Nicht dass bei jeder Erneuerung die gleichen Nicht-Fehler nochmals auftauchen, und blacklisten will ich auch nicht so richtig. Im Zuge dieses Umbaus schau ich dann, wie ich das mit den Dubletten lösen kann. --Wurgl (Diskussion) 19:37, 22. Aug. 2018 (CEST)
@Kolja21: Wenn nix dazwischenkommt, dann mach ich das morgen fertig, spätestens übermorgen. Willst du alle haben, bei denen GND gefüllt ist und REMARK gefüllt ist und die GND nicht in einer der Fehlermeldungslisten vorhanden ist, oder willst du nur die haben, bei denen im Feld REMARK auch eine GND/Tp/Tn zu finden ist. Im ersten Fall kämen halt auch die raus, wo sowas wie "VIAF vermischt" oder "unsicher" drinnen steht, im zweiten Fall nur die nicht gemeldeten. --Wurgl (Diskussion) 17:07, 18. Sep. 2018 (CEST)
@Wurgl: Danke. Die "kleine" Liste mit GND/Tp/Tn reicht mir vollkommen. --Kolja21 (Diskussion) 17:22, 18. Sep. 2018 (CEST)
Ui! Von wegen "kleine Liste", das werden ca. 1100 Einträge :-( Die ersten paar Stichproben scheinen zu passen. --Wurgl (Diskussion) 11:11, 19. Sep. 2018 (CEST)

VIAF ergänzen

Also momentan stellt sich das so dar: 41000 VIAF mit weiteren Bibliothekseinträgen wären händisch zu ergänzen, 65000 sind solche die verzichtbar sind oder automagisch ergänzt werden können. Diese 65.000 haben nur einen Link auf die DNB und ev. einen auf ISNI oder auf Wikidata. --Wurgl (Diskussion) 22:02, 3. Okt. 2018 (CEST)

Hat VIAF mittlerweile alle Tn's rausgeschmissen? --Kolja21 (Diskussion) 23:33, 3. Okt. 2018 (CEST)
Letzte Woche hab ich noch welche gesehen. Ich hab so das Gefühl, das sind alles Überbleibsel von Tns die bei Wikidata mal dran waren. Ist aber nur so ein Gefühl.
So nebenbei: VIAF hat auch direkte Links auf Wikipedia. Die werden nicht angezeigt, ebenso auf z.B. bei VIAF:133156117 ist im Dump ein Link auf http://www.geonames.org/3164697 zu sehen oder bei VIAF:101916432 auf http://orcid.org/0000-0001-6757-9211 oder bei VIAF:308265063 ein Link auf http://www.imj.org.il/imagine/thesaurus/artists/T76901.htm … muss das irgendwann mal genauer erforschen. --Wurgl (Diskussion) 23:44, 3. Okt. 2018 (CEST)

Neue Dumps

Es gibt neue Dumps, sowohl von VIAF als auch von DNB. Ich werde daher morgen eine neue Liste erstellen. --Wurgl (Diskussion) 23:53, 6. Nov. 2018 (CET)

Gibt schon seit ein paar Tagen einen neuen Dump der VIAF. Ich muss morgen noch ganz wichtig und ganz weit weg Weihnachten feiern und werde Samstag am Abend oder am Sonntag die Liste neu erzeugen. Hab dieses Monat ca. 2000 VIAFs zu Tps ergänzt und mich weniger hier aufgehalten. --Wurgl (Diskussion) 16:48, 13. Dez. 2018 (CET)
Die DNB hatte einen neuen Dump, die haben jetzt Verwandtschaftsverhältnisse (Eltern/Kinder/Geschwister,Großeltern/Enkel,Onkel&Tanten/Neffen&Nichten,Lehrer/Schüler,Kollegen,Freund) bei einigen Datensätzen. Beispiel: GND 100000193, GND 100065457 oder GND 128704020. Eventuell mag @MisterSynergy: da mit Wikidata was machen?
Die VIAF hat natürlich auch einen neuen Dump.
Und meine Scripte auf toolforge sind nach dem Crash der Datenbank neu geschrieben, verwenden jetzt platzsparendere Datenstrukturen und haben kleine Unterschiede (HTML-Kommentare etc. in Parametern bleiben erhalten bzw. stehen jetzt auch in der Datenbank). Und ich bin bei ziemlich allen Daten nur ein paar Minuten hintennach (auch auf der persondata-Webseite).
Kann sein, dass jetzt leichte Unterschiede auftreten und ein paar Sachen nicht gar so toll sind, hab die Liste nur ganz grob angeguckt. --Wurgl (Diskussion) 22:02, 19. Mär. 2019 (CET)
Danke für den Ping. Ich müsste dann User:Jneubert mal fragen (hiermit getan), ob der neue Dump auch bereits im experimentellen SPARQL-Endpoint zur Verfügung steht. Wenn das so ist, würde ich (in absehbarer Zeit) erneut mit Wikidata abgleichen und dort ein paar Korrekturen einspielen. Wegen der Verwandtschaftsverhältnisse könnten wir weitere Abfragen schreiben, mit denen das in Wikidata abgebildet oder verglichen werden könnte. —MisterSynergy (Diskussion) 23:01, 19. Mär. 2019 (CET)
Eins neues Update gibt's noch nicht. Ich versuche, das in der Woche vom 8.-12.4. unterzubringen - oder sonst Ende Mai/Anfang Juni. Geplant ist dabei, das Ganze so zu scripten, dass es automatisiert ausgeführt werden kann. Jneubert (Diskussion) 11:18, 20. Mär. 2019 (CET)
Ui das mit dem scripten ist so eine Sache. Bisher haben sich so ziemlich jedesmal die Namen des bzw. der Dumps geändert. Ich hoffe das ändert sich nicht mehr allzuoft :-( Und die Inhalte änderten sich auch jedesmal, irgendwelche neuen Felder sind jedes mal dazugekommen (okay, die unbekannten kann man ja ignorieren). --Wurgl (Diskussion) 11:37, 20. Mär. 2019 (CET)
@Wurgl: Danke für die Arbeit! Ich freue mich vor allem darüber, dass sich die Kategorie:Wikipedia:Veraltete Normdaten langsam leert. --Kolja21 (Diskussion) 23:03, 19. Mär. 2019 (CET)

Neue Fehlerquelle identifiziert

Bisschen schwer zu erklären, ich hatte am Vormittag so einen Fall, dass nach einer Umbenennung/Verschmelzung einer Organisation, diese auch hier ein neues Lemma bekam. Und bei der DNB einen Nachfolger. Die Normdaten blieben aber die alten und passten wohl nicht so ganz toll.

Hier könnte das irgendwann passieren: Diskussion:Ost-Ausschuss_der_Deutschen_Wirtschaft#Veraltete_Information?

Mal sehen, sowas zu entdecken ist etwas wild. Vielleicht schaff ich das irgendwann(!) ohne allzuviele False-Positive. --Wurgl (Diskussion) 18:45, 16. Dez. 2018 (CET)

Wegen Updates …

Es ist seltsam. Der VIAF-Dump wurde zwar am 3. Juni erzeugt, bzw. das File hat den Namen "viaf-20190603-links.txt.gz", aber erst gestern (am 14. Juni) am Nachmittag war das File auf dem Webserver. Am Vormittag hab ich geguckt, da war noch nichts. --Wurgl (Diskussion) 08:17, 15. Jun. 2019 (CEST)

Ich häng mich mal da dran.
Die DNB ist etwas schnarchnasig unterwegs. Eigentlich ist der neue Dump dieses Monat fällig, aber da ist immer noch nix: https://data.dnb.de/opendata/ --Wurgl (Diskussion) 11:04, 22. Okt. 2019 (CEST)
Man könnte mittelfristig auf einen OAI-Harvester umsteigen, dann hätte man regelmäßige (zumindest wöchentliche, wenn ich es recht verstehe) Aktualisierungen, aber das würde wohl nicht unerhebliche technische Umstellungen erfordern … --emu (Diskussion) 11:55, 22. Okt. 2019 (CEST)
Hab mal nachgefragt ob vergessen oder so. Außerdem hab ich auf Hilfe_Diskussion:GND#Webformular aufmerksam gemacht und dann war noch was mit Weiterleitungen von zusammengeführten GNDs vom Typ "Werk" die nicht zur neuen Werks-GND weiterleiten, sondern zum Autor des Werk. Mal sehen. --Wurgl (Diskussion) 10:58, 28. Okt. 2019 (CET)
Argh! Ein Abschnitt darunter steht ja das Problem mit den Weiterleitungen. --Wurgl (Diskussion) 12:14, 28. Okt. 2019 (CET)
So in einer halben Stunde kommt eine neue Liste, GND-Dump ist gekommen. --Wurgl (Diskussion) 21:47, 5. Nov. 2019 (CET)
Dauert etwas länger, die VIAF hat auch neue Dumps und bei denen dauert das runterladen ewig :-( --Wurgl (Diskussion) 22:10, 5. Nov. 2019 (CET)
Keine Eile (es gibt noch genug abzuarbeiten) & danke schon mal. BTW: Kennst du dich dem Import von Daten in Wikidata aus? Im Grund könnte wir - analog zu anderen Datenbanken - individualisierte GNDs (z.B. jene für Personen mit Sterbejahr vor 1850), auch ohne dass ein Wikipediaeintrag zu der Person vorliegt, in Wikidata übernehmen. @Magnus Manske: Was hälst du davon? Du hast, wenn ich mich recht erinnere, entsprechende Erfahrungen mit der (P1871). --Kolja21 (Diskussion) 22:55, 5. Nov. 2019 (CET)
Bei Wikidata hab ich nur ein paar sehr kleine Schritte unternommen, von Auskennen bin ich meilenweit entfernt und an einen Import mag ich mich nicht rantrauen. --Wurgl (Diskussion) 23:04, 5. Nov. 2019 (CET)
Ich verwende seit einigen Wochen ein selbstprogrammiertes Skript, das aus GNDs Quickstatements für den Import in Wikidata erzeugt. Auch aus den Erfahrungen damit bin ich skeptisch bezüglich Massenimporten. Ich befürchte, dass die zu schwer wartbaren Einträgen führen, wenn sie nicht intellektuell bearbeitet werden --emu (Diskussion) 23:09, 5. Nov. 2019 (CET)
Danke für das schnelle Feedback. Ich denke auch, dass wir das koppeln müssten (Quickstatements mit intellektueller Überprüfung). Andererseits fällt mir immer wieder auf, wie viele Einträge bei Wikidata eine VIAF-ID haben, aber die GND (obwohl in VIAF erfasst) fehlt. --Kolja21 (Diskussion) 00:53, 6. Nov. 2019 (CET)
Es gibt auf Wikidata erstaunlicherweise auch über 13.000 Personendatensätze mit GND, aber ohne VIAF. Langweilig wird uns nicht. --emu (Diskussion) 12:18, 6. Nov. 2019 (CET)
Hab heute per Mail erfahren, dass der Dump voraussichtlich noch diese Woche erstellt wird *schenkleklopf* Manchmal ist E-Mail eben doch noch schnarchlangsam. Das Fehlerchen vom Absatz darunter ist auch bekannt *seufz* und zum Webformular gabs ebenfalls nur den Satz dass daran gearbeitet wird. Aber Rom ist ja auch nicht an einem Tag erbaut worden. --Wurgl (Diskussion) 10:32, 8. Nov. 2019 (CET)

Bot-Edits in Wikidata

@Wurgl: Wie kommt es, dass deine Liste schlauer ist als d:User:KrBot?

Wertest du den GND-Typ mit aus oder wie bist du auf den richtigen Datensatz gekommen? Gruß --Kolja21 (Diskussion) 03:33, 19. Jul. 2019 (CEST)

Seltsam. Ich hab nur diese Id: 300602847. Ich werte in https://data.dnb.de/opendata/ diese sieben authorities-<TYP>_lds.rdf.gz Dateien aus. Und da ist nur beim Datensatz 300602847 ein Verweis auf die alte 4780154-2. (So ähnlich, wie bei GND 300602847 rechts: MARC21-XML und dort dann Typ 035, subfield a und z / bzw. Zeilen 13-26 im File). Ich hab nochmals das 12 GB-Monster authorities-person_lds.rdf.gz (ausgepackt: 12.113.955.030 Byte) nach der Id 4780154-2 durchsucht und da gibt es nix. Ich denke, ich frage da meinen Kontaktmann, das ist jedenfalls seltsam. --Wurgl (Diskussion) 07:59, 19. Jul. 2019 (CEST)
Ich guck grad nochmals in dieses File authorities-werk_lds.rdf.gz. Ein anderes Werk: GND 7615448-8 (Sinfonien op. 10) sollte nach GND 300600690 umlenken, zeigt aber auf die Person GND 119057077. Stich ins Wespennest? Gleiche Sache bei GND 7595271-3 Sollte nach GND 300611153 gehen. --Wurgl (Diskussion) 08:15, 19. Jul. 2019 (CEST)
Danke, dass du die DNB und Ivan in WD angeschrieben hast. Bin gespannt, was sie sagen. Ich dachte, die alten SWD-Einträge für musikalische Werke würde jetzt einfachheitshalber auf die Komponisten umgeleitet, aber offenbar liegt ein technisches Problem vor. OGND 119057077 vermerkt GND 7615448-8 nicht als Weiterleitung, sondern GND 7615448-8 ist korrekt unter OGND 300600690 eingetragen. --Kolja21 (Diskussion) 21:32, 19. Jul. 2019 (CEST)
Hat wohl Urlaub, aber bis 2021 wird er schon zurück kommen *g* --Wurgl (Diskussion) 21:46, 19. Jul. 2019 (CEST)

2 oder mehr Wikidata-Objekte zu einer VIAF

Ich kopier mal das von vorne:


  • @Emu: zwei Wikidata-Objekte sind der VIAF zugeordnet. alternative VIAF für die Band wäre: VIAF:61151302915948661572 (mit LCCN).
    Dazu generelle Frage: Ich könnte alle VIAFS, die hier in der deWP eine Zuordnung und zwei oder mehr Wikidata-Objekte haben, raussuchen. Interesse? --Wurgl (Diskussion) 09:15, 3. Nov. 2019 (CET)
    @Wurgl: Interessant wäre es schon, wobei ich bei den Körperschaften kaum Erfahrung habe. Ich beschäftige mich mit ihnen nur dann, wenn ich sie bei den Personen brauche, und auch dann nur ungern … kann also bei der Bearbeitung wahrscheinlich keine große Hilfe sein --emu (Diskussion) 18:49, 3. Nov. 2019 (CET)

Ich hab mal flott 477 solche VIAF identifiziert, davon 33 Stück mit 3 oder mehr Wikidata-Objekten, 3 VIAFS mit 5 Wikidata-Objekten sind Rekordhalter: VIAF:122012094, VIAF:149849706 und VIAF:155855229 (Norwegen!?). Eventuell mag das MisterSynergy interessieren. --Wurgl (Diskussion) 19:04, 3. Nov. 2019 (CET)
Eine Stichprobe: (Q7060816), Oregon ist in Wikidata mit der (korrekten) VIAF:177721085 verknüpft. Dort steht in der Versionsgeschichte "WKP|Q7060816 delete 2019-02-10". Der Algorithmus probiert immer wieder neue Verknüpfungen aus, und das geht in Einzelfällen schief. Für uns sehe ich keinen Handlungsbedarf. --Kolja21 (Diskussion) 20:05, 3. Nov. 2019 (CET)
Ich papp mal die Personen rein. Mehr als ignorieren kann ja nicht passieren. Datenbestand ist vom 9. Oktober.

--Wurgl (Diskussion) 08:17, 4. Nov. 2019 (CET)

Auslagerung - Kommentierte Fälle

Moin Moin Wurgl, ich glaube die kommentierten Fälle sollte man tatsächlich mal auslagern, da sie die Seite unnötig füllen. Wo wäre denn ein geeigneter Ort? "/Fehler GND - Kommentierte Fälle"? mfg --Crazy1880 20:38, 4. Dez. 2019 (CET)

Beim nächsten Lauf mach ich das. --Wurgl (Diskussion) 21:09, 4. Dez. 2019 (CET)

Parameter GND ergänzen (TYP=p) – alle Einträge

@Wurgl: Ich habe bemerkt, dass die Arbeit an Parameter GND ergänzen (TYP=p) rationeller und weniger mühsam ist, wenn man in Blöcken nach erstanlegenden Bibliotheken arbeitet (also zB nur welche von der Stabi statt bunt gemischt). Gibt es eine Möglichkeit, alle betroffenen GND und Artikel zu bekommen (also alle ~15.000)? Die ISIL der anlegenden Bibliotheken kann ich dann selbst mit Skript ermitteln (kann man wohl nicht dazuschreiben, weil sie zwar in den Marc-Daten, aber nicht in den RDF-Daten verzeichnet sind). Danke! --emu (Diskussion) 14:59, 13. Dez. 2019 (CET)

Wenn ich eine Möglichkeit schaffe, dann gibt es die ;^)
Ich kann die volle Liste in ein File schreiben und dir dann den Teil mit den Personen zukommen lassen. Wäre das okay? --Wurgl (Diskussion) 15:39, 13. Dez. 2019 (CET)
+1. Gute Idee. --Kolja21 (Diskussion) 16:26, 13. Dez. 2019 (CET)
https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen.txt
Wenn du Scripte schreiben kannst, dann kannst auch die VIAF-Ergänzungen rausfiltern *denk*
Hinweis zu "gute Übereinstimmung"/"schlechte Übereinstimmung" Da werden unsere Namen (aus Personendaten) mit einem der Namen (auf der Webseite der GND: Felder "Person" und "Andere Namen") verglichen. Mehr wird nicht verglichen. --Wurgl (Diskussion) 17:54, 13. Dez. 2019 (CET)
Herzlichen Dank, ich werde schauen, wie ich die Daten elegant konvertieren kann. Bei der Gelegenheit: Fällt euch eine Möglichkeit ein, elegant zur GND auch die PPN-Nummer zu bekommen (außer jedes Mal bei OGND nachzuschauen)? --emu (Diskussion) 16:15, 14. Dez. 2019 (CET)
@Wurgl, Kolja21: Ich habe auf Benutzer:Emu/GND (vorläufig mit Herumgebastel) etwas probiert. Wenn es sich bewährt, kann ich versuchen, mein Sammelsurium aus diversen teilautomatischen Skripten zu verbessern. Die Seite kann natürlich bearbeitet werden! --emu (Diskussion) 01:53, 15. Dez. 2019 (CET)
Sieht gut aus. Ich schau' mal, wie viele der Tp6 ich erg. kann. --Kolja21 (Diskussion) 01:55, 15. Dez. 2019 (CET)
Ich denke, mal es wäre schlau, wenn ich die Liste neu generiere und dabei die Links auf der Emu-Seite filtere … Einwände? --Wurgl (Diskussion) 12:35, 15. Dez. 2019 (CET)
Gerne, wenn dir das nicht zu viel Arbeit macht. --Kolja21 (Diskussion) 14:03, 15. Dez. 2019 (CET)
Ebenfalls gerne, eventuell wird die Seite aber noch erweitert – speziell die Unterteilung in Katalogisierungslevels scheint sich zu bewähren --emu (Diskussion) 14:06, 15. Dez. 2019 (CET)
Vor allem die Tp6 sind ein Gewinn. Ist schon interessant, wie die Stabi Berlin Quellen zitert. Da wird aus dem Geburtsort Klagenfurt "Klagenfurth" (Quelle: Wikipedia) oder aus Bernard de L’Escaille de Lier ein "Bernard de 3/4' Escaille de Lier" (Quelle: WBIS). BTW: Das GND-Webformular bietet uns jetzt die Möglichkeit an, auch Datensätze zu Organisationen zu korrigieren. --Kolja21 (Diskussion) 15:51, 16. Dez. 2019 (CET)
Det jibbet! http://www.zeno.org/DamenConvLex-1834/A/Klagenfurth (PS: Besser als Klagenfurz) ein SmileysymbolVorlage:Smiley/Wartung/teufel  --Wurgl (Diskussion) 16:02, 16. Dez. 2019 (CET)
Kolja21, kannst du in GND 1055833943 die Vorgänger/Nachfolger-Kette auflösen? Siehe The Surfaris und The Original Surfaris --Wurgl (Diskussion) 10:22, 17. Dez. 2019 (CET)
Nein, leider nicht. Beide Datensätze haben den Katalogisierungslevel 1 und sind damit für Änderungen über das Webformular gesperrt. --Kolja21 (Diskussion) 14:06, 17. Dez. 2019 (CET)

@Wurgl: Nachdem die Listen vermutlich in der nächsten Zeiten abgearbeitet werden können (nur noch ca. 240 Fälle), wollte ich fragen, ob die Liste https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen.txt in nächster Zeit (zB gemeinsam mit dem nächsten Lauf, damit die Dopplungen möglichst ohne viel Arbeit verhindert werden) neu erstellen könntest? Dann könnte ich meine Seite wieder neu erstellen. --emu (Diskussion) 17:45, 19. Jun. 2020 (CEST)

@Emu: https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen2.txt
Das sind jetzt *ALLE* restlichen, die (ersten) überschneiden sich mit der Vorderseite. Also eventuell nimm dir zuerst die am Ende vor. Aber es sind nunmal nur noch 9.434. --Wurgl (Diskussion) 00:13, 26. Jun. 2020 (CEST)

Neue Liste

@Crazy1880, Silewe, Wurgl, Kolja21: Danke, Wurgl! Auf Benutzer:Emu/GND gibt es nun 8445 (= alle außer die ersten 1000) nach anlegenden Bibliotheken und Katalogisierungslevel geordnete mögliche Zuordnungen. --emu (Diskussion) 20:28, 26. Jun. 2020 (CEST)

VIAF wechsle dich?

@Kolja21: Was ist da los? Am 18. Februar hab ich VIAF:7194152503063910800000 gegen VIAF:2307152451235806650004 getauscht, und jetzt wieder VIAF:7194152503063910800000?
Archivversion der VIAF 2307152451235806650004 vom 5. März 2020: http://archive.is/mVBXL
Archivversion der VIAF 7194152503063910800000 vom 5. März 2020: http://archive.is/pKRVu
Mit den Archivversionen kann ich bei nochmaligem Wechsel gezielt nachfragen. Gibts für die VIAF einen Ansprechpartner in der Wikipedia-Welt? --Wurgl (Diskussion) 11:01, 5. Mär. 2020 (CET)
@Wurgl: In den genannten Fällen liegen keine regulären Normdatensätze vor. Extended VIAF Authority (xA) und Extended Relationships (xR) sind Hilfseinträge oder Testläufe von OCLC. Diese Datensätze würde ich ignorieren und nicht in die Normdatenvorlage übernehmen. Einen Ansprechpartner bei VIAF gibt es leider nicht. Gruß --Kolja21 (Diskussion) 14:11, 5. Mär. 2020 (CET)
Ich werde mal die Anzahl solcher Fälle auswerten. Eventuell könnte man da einen Satz in Hilfe:Normdaten#VIAF ergänzen. --Wurgl (Diskussion) 17:16, 5. Mär. 2020 (CET)
VIAF ist halt vom Prinzip her strenggenommen keine Normdatei, sondern eher eine Suchmaschine. Die Cluster werden ständig neu zusammengestellt. Was xA und xR betrifft, ist das meine persönliche Meinung und keine offizielle Mitteilung, die man in Hilfe:Normdaten#VIAF ergänzen könnte. OCLC/VIAF hält sich leider mit Informationen über ihrer Arbeitsweise bedeckt. --Kolja21 (Diskussion) 18:08, 5. Mär. 2020 (CET)
255 solche VIAFs haben wir zugeordnet. --Wurgl (Diskussion) 18:36, 5. Mär. 2020 (CET)

Noch einer, den ich archiviere:

Archivversion der VIAF:309285222 vom 5. März 2020: http://archive.is/D97ln
Archivversion der VIAF:4230158309838806690007 vom 5. März 2020: http://archive.is/H12jN
--Wurgl (Diskussion) 11:19, 5. Mär. 2020 (CET)

Und weil es so schön ist:

Archivversion der VIAF:3937156990990061180007 vom 5. März 2020: http://archive.is/W2JSo
Archivversion der VIAF:7149158188273220260008 vom 5. März 2020: http://archive.is/O8EEP
--Wurgl (Diskussion) 11:32, 5. Mär. 2020 (CET)
Archivversion der VIAF:9664151051971733530001 vom 5. März 2020: http://archive.is/HYvnB
Archivversion der VIAF:9006158188197420260008 vom 5. März 2020: http://archive.is/uQ66z
--Wurgl (Diskussion) 11:38, 5. Mär. 2020 (CET)

Das geht schon seit Jahren so. Danke für die Doku! Bibliotaker (Diskussion) 21:59, 16. Mär. 2020 (CET)

Tp Tachometer

Mein bestes war 20 min für 25 [1]. Die waren aber alle sehr einfach. Gerundet 1 min/Tp. Aber die reine Entscheidungszeit sind vielleicht 6 Sekunden. D.h. 90% geht mit Klicken und Scrollen drauf. Bibliotaker (Diskussion) 21:56, 16. Mär. 2020 (CET)

Abbau Rückstand Eintragung GND TYP=p

Ich überlege immer noch, wie sich die GND TYP=p schneller auffüllen lassen, ist ja nicht nur der derzeitige Bestand, sondern kommt immer wieder etwas hinzu. Ca. 1/3 der WP sind Personenartikel (code=piz), täglich 100+ neue P-Artikel. Die umseitige Liste bezieht sich wohl nur auf Fälle wo VIAF vorhanden, Kolja21 hat mir petscan geschickt wo gar keine ND in WP vorliegen, aber GND in Wikidata vorhanden. Hatte da Fälle, da verweist die DNB/GND-Seite im HTML unter Quelle direkt auf den WP-Artikel mit Stand 2018. Die GND liegt also schon lange und einfach findbar und hochgradig sicher vor.

Es gibt sicher mehrere Stellschrauben, davon einiges als Vereinfachung für den einzelnen Bearbeiter, anderes nur als Animation zum Mitmachen. Brainstorming:

  • Artikel und DNB-Portal öffnen:
    • in der Liste mit einem Klick zwei Tabs öffnen lassen, einer für Artikel, einer für GND-Link
    • oder mehrere Artikel mit einem Klick
    • oder beides zusammen, wobei Artikel und zugehörige GND-Seite immer nebeneinander
  • Runterscrollen im Artikel: PD+ND+ggf. Kategorien oben im Artikel anzeigen
  • Runterscrollen bei GND-Seite: mit ihren Bibliothekhinweisen - ich will nur Normdaten anschauen - nerven die,
    • ggf. durch ein anderes Tool durchziehen der nur den relevanten HTML-Block anzeigt
    • ich weiß nicht ob man ein runterscrollen per JS automatisieren kann
  • Austragung - wenn ich eine GND ergänze, könnte ein Bot, ggf. mit ~10min Verzögerung (falsch gespeichert, selbst revertiert), diese austragen
  • Benutzer:Wurgl/Fehler_GND#Parameter_GND_ergänzen_(TYP=p) : Auslagerung zumindest dieses Bereichs? Oder aller Bereiche GND-Ergänzung nach Typ in eigene Seiten? Aber zumindest GNDp
    • wenn Seite neu geöffnet muss man erst in den Abschnitt, wer schon Link mit Anker hat OK, aber mancher vielleicht nicht.
    • Ladezeit/Browserressource - es wird die gesamte Seite geladen, auf schmaler Hardware ist das Stress, ich öffne teilweise 25er-Abschnitt zum bearbeiten und gehe auf Vorschau, einfach damit weniger im Browser ist, aber manchmal muss ich was reinschreiben, dann wieder ganze Seite neu
    • Beobachtbarkeit - Es gibt wohl die Möglichkeit Seiten zu beobachten, hab ich noch nicht probiert, aber für Leute mit Fokus auf Ergänzung der GND TYP=p, Biografieverbesserer, wäre dies wohl praktisch.
    • Auch sieht man leichter wer noch an dem Thema dran ist, kann sich eventuell zu GNDp-auffüll-editathons verabreden.
    • Skripte könnten leichter genau auf die GNDp-Liste zurückgreifen, siehe oben unter Austragung.
  • mehr Leute zum Mitmachen annimieren - z.B. in Kategorienseiten die GNDp-Füllstände anzeigen. Es gibt seit gestern Vorlage:Kategorie Person, die einige Vorlagen bündelt und leicht um einen Füllstandsanzeiger erweitert werden kann - wenn man die Füllstände messen kann. Anzahl der Seiten inkl. Unterseiten ist teilweise vorhanden in {{Metadaten Artikelanzahl}}.

Bibliotaker (Diskussion) 13:51, 23. Mär. 2020 (CET)

Nein! Du irrst. Da liegt nix sicher vor.
Der Link zur Wikipedia auf der Seite der DNB kommt von VIAF. Und VIAF bezieht diese Daten aus der eigenen Logik zum Zusammenführen. Diese Logik zum Zusammenführen übernimmt auch Daten von Wikidata. Irgendwann (ich glaub August) 2015 ist in Wikidata mal ein Bot gelaufen, der VIAF-Id bei Wikidata reingemacht hat. Ich hab keinen Schimmer wie die da reingekommen sind, halt irgendwie. Nochmals zum Weg Wikidata -> VIAF. Es genügt, dass in Wikidata eine VIAF-ID (die muss nicht die richtige sein) eingetragen ist und in Wikidata ist ein Artikel der deutschen Wikipedia eingetragen. Jetzt fehlt nur noch so eine Daumen mal Pi Logik, die diesem Cluster aus Wikidata (inkl. Links auf die Wikipedia-Artikel) und noch irgendwas mit irgendeiner halbwegs passenden GND verbindet. Schwupps ist im DNB-Datensatz ein "Link zur Wikipedia" zu lesen. Da ist nix sicher. "Recht" sind nur die Datensätze, wo in der Bemerkung die Wikipedia erwähnt wird.
Und zu den anderen Sachen: Sorry. Bei Javascript steig ich aus. Ich kann es lesen, ich kann simple Änderungen machen, aber bei komplexeren Dingen … da muss ein anderer ran. --Wurgl (Diskussion)
"Link zur Wikipedia auf der Seite der DNB kommt von VIAF" (Wurgl) und "GND nennt Wikipedia als Quelle" (Beispiel: GND 1128914190) sind zwei unterschiedliche Dinge. (@Bibliotaker: Ich denke, du meinst Fall 2.) Und was die Auslagerung betrifft: Da gibt es bereits einen interessanten Versuch Benutzer:Emu/GND. --Kolja21 (Diskussion) 15:50, 23. Mär. 2020 (CET)
Ja. Das meinte ich ganz am Ende mit "Recht sicher". Nur diese Info werte ich nicht aus.
Aus der VIAF kommt z.B. DNB 1201444012 das muss angestarrt werden, obwohl es oft passt. --Wurgl (Diskussion) 16:02, 23. Mär. 2020 (CET)
451 Stück wäre das, wo "Wikipedia" in der Quelle bei der DNB genannt ist und wo die GND bei uns nirgendwo zugeordnet ist. Doch da sind aber so manche dabei, die zwar ein Artikelchen in der engl. Wikipedia haben, aber nicht in der deutschen. z.B: DNB 1201844878 = en:Chen Shih-meng. oder DNB 1194672035 (Link ist im Datensatz) --Wurgl (Diskussion) 16:19, 23. Mär. 2020 (CET)
Imho wäre es sinnvoll, bei Fällen wie GND 1194672035 = (Q16933564) die GND per Bot in Wikidata einzutragen. Anschließend tauchen die Einträge, die uns betreffen, in der Kategorie:Wikipedia:GND in Wikipedia fehlt, in Wikidata vorhanden auf. --Kolja21 (Diskussion) 18:06, 23. Mär. 2020 (CET)
@Kolja21: wär ich auch dafür. Und wenn da statt en.wikipedia de.wikipedia.org steht? Ab wann matcht ein Mensch? Geburts/Todesort+zeit gleich? Bibliotaker (Diskussion) 07:33, 25. Mär. 2020 (CET)
Paul Schneider (Maler) http://d-nb.info/gnd/1058770861 im HTML Quelle
Gut, der ist verschoben, nicht exakt ein Beispiel was ich meinte, aber schon seit 2014! Kommt nicht via VIAF. Rechts mit Beschriftung "Zugehöriger Artikel in Wikipedia" Link zu https://de.wikipedia.org/wiki/Paul_Schneider_%28Maler%29 .das ist der, der wohl auch in RDF/Turtle hinterlegt ist, das kommt eventuell von VIAF/Wikidata. Ich hatte da dutzende Fälle wo in HTML unter "Quelle" genau Rückverweis. Bibliotaker (Diskussion) 07:23, 25. Mär. 2020 (CET)
@Bibliotaker: Nebenbemerkung: Ich habe den Kommentar mal etwas lesefreundlicher gestaltet. Auf die GND kannst du mit den Vorlagen {{GND}}, {{Tp}} und {{Tn}} verlinken. Fröhliches Schaffen --Kolja21 (Diskussion) 19:16, 25. Mär. 2020 (CET)

Neue Liste [2020]

@Kolja21, Silewe: Hab gerade gesehen, die VIAF hat einen neuen Dump.

Ich würde heute so ab 23 Uhr gerne eine neue Liste erzeugen. Die Kommentare kommen dann (wie immer) auf die "Rückseite". Ich werde 1000 TYP=p und 500 bei den anderen Typen generieren. --Wurgl (Diskussion) 21:11, 11. Apr. 2020 (CEST)

Klasse "The persist-rdf.xml file has been removed and will no longer be available." steht ganz unten auf http://viaf.org/viaf/data/
also gibt es die Liste der ungültigen VIAFs nicht mehr … --Wurgl (Diskussion) 22:39, 11. Apr. 2020 (CEST)

Ich hab ja vorgestern auf einen neuen Dump der VIAF in den nächsten Tagen gehofft und daher erstmal nix generiert. Dump ist da … Liste in so 1-2 Stunden. --Wurgl (Diskussion) 21:57, 5. Mai 2020 (CEST)

Danke für deine Arbeit! --Kolja21 (Diskussion) 02:43, 6. Mai 2020 (CEST)

@Kolja21, Silewe: VIAF hat einen neuen Dump, ich generiere in 2-3 Stunden dann eine neue Liste. --Wurgl (Diskussion) 20:32, 3. Jun. 2020 (CEST)

@Kolja21, Silewe: VIAF hat einen neuen Dump. Liste wird generiert. --Wurgl (Diskussion) 10:09, 2. Jul. 2020 (CEST)

Ich geh mal zum Baumarkt und kauf mir 2 Glasbausteine für die Brille. *gna* Juni != Juli! --Wurgl (Diskussion) 10:50, 2. Jul. 2020 (CEST)
@Kolja21, Silewe: Aber jetzt steht dort eindeutig Juli, also bau ich eine neue Liste! --Wurgl (Diskussion) 09:39, 8. Jul. 2020 (CEST)

@Kolja21, Silewe, Emu: Es gibt einen neuen Dump der DNB in https://data.dnb.de/opendata/ Namensdatensätze gibt es nicht, das muss ich dann wohl bei mir anpassen (so ziemlich alles mit Tn's muss ich rausnehmen), wird wohl bis morgen/ü-morgen dauern und dann kommt eine neue Liste. Siehe auch Vorlage Diskussion:Normdaten#"14.000_Tn_werden_zu_Tp6". Alternativ könnte ich die Namensdatensätze des vorherigen Dumps nehmen, da muss ich aber die 14.000 Tn welche zu Tp wurden, rausnehmen. Mal sehen. --Wurgl (Diskussion) 14:17, 15. Jul. 2020 (CEST)

Wenn ich es richtig sehe, hat sich die Anzahl der Tp von 5.251.171 (Feb.) auf 5.350.953 erhöht. D.h. knapp 100.000 neue Personen (incl. Dubletten) sind dazugekommen. Jetzt wäre es natürlich spannend zu wissen, wie viele davon ehemalige Tns sind. --Kolja21 (Diskussion) 17:28, 15. Jul. 2020 (CEST)
In meinem Hirn denkt es :-) Will sagen: ich kann mich nicht wehren und das Thema verdrängen. Jedenfalls tendiere ich dazu, die Tns vom letzten Dump mit in die Auswertung zu nehmen, Dann kann ich in der Liste solche umgewandelten irgendwie anmerken. Außerdem kann es ja immer noch sein, dass ein paar Phantasie-Tns eingetragen wurden, etwas über 1 Monat lang nach de Dump gab es die ja noch. Neuzuordnungen von Tns werd ich aber sicher weglassen. Was mir nicht klar ist: Sind auch welche gelöscht worden, also so richtig weg dass beim Aufruf ein 404er kommt. --Wurgl (Diskussion) 18:10, 15. Jul. 2020 (CEST)
Eine Komplettlöschung wäre ungewöhnlich. Das gab es zu PND-Zeiten ab und an, aber bei der GND habe ich das nicht mehr erlebt. --Kolja21 (Diskussion) 19:54, 15. Jul. 2020 (CEST)
PS: Was meinst du mit "Phantasie-Tns"? Welche waren das? --Kolja21 (Diskussion) 20:08, 15. Jul. 2020 (CEST)
Tippfehler oder Ids von Werken aka. Katalognummern. --20:20, 15. Jul. 2020 (CEST)
Heute wird nix mehr. Ich hab bisher aus den Typen wie "Person (piz)", "Pseudonym (pip)", "Organisation (kiz)" etc. unsere Typen "Person", "Körperschaft", "Veranstaltung", etc. gebildet. Damals als es nur eine Dumpdatei gab, war das nicht anders möglich. Jetzt trennt die DNB aber in 6 einzelne Typen (bzw. mit Namen sind es 7) und bei manchen Typen, wie "Historisches Einzelereignis (sih)" oder "Personengruppe (siu)" ist die DNB etwas freizügig, bei "sih" ist es mal ein Wer und mal eine Veranstaltung, bei "siu" mal eine Körperschaft und mal eine Person. Weitere hab ich (noch) nicht geguckt. Das bau ich auch gleich um und hol mir diesen Typ aus dem Namen des Dumpfiles. --Wurgl (Diskussion) 22:03, 17. Jul. 2020 (CEST)
Hat keine Eile. Wir habe ja noch ein paar Fälle zum Abarbeiten. Bin auf jeden Fall auf die neue Liste gespannt. --Kolja21 (Diskussion) 22:36, 17. Jul. 2020 (CEST)

@Kolja21, Silewe: Ich hab vorhin gesehen, dass es einen neuen DNB-Dump gibt und würde gerne neu generieren. Okay oder noch auf etwas warten? --Wurgl (Diskussion) 14:26, 6. Mär. 2021 (CET)

Von mir aus gerne! Bin gespannt, ob seit dem 20. November wieder ein paar Dubletten ohne unser Zutun abgearbeitet wurden. Die Kategorie:Wikipedia:Veraltete Normdaten leer sich nur langsam. --Kolja21 (Diskussion) 14:41, 6. Mär. 2021 (CET)
GND-Name leert sich ebenfalls langsam. Ich guck die "Verbrechen" des Bot ja jeden Tag an und da sind immer wieder ein paar entfernte GNDName dabei. --Wurgl (Diskussion) 14:44, 6. Mär. 2021 (CET)

GND/F

Wegen Änderungskommentar in Spezial:Diff/203007780: Ich werde mal versuchen, REMARK mit dem Inhalt "…ND/F…" auszuwerten. Sind aktuell 764 Stück. Mal sehen, ob ich da klarkomme.

Und die andere Richtung wäre: In der Fehlermeldung kommt die GND vor, hat dort keinen Erledigt-Vermerk und in REMARK steht nix von "…ND/F…".

Hab ich das richtig verstanden? --Wurgl (Diskussion) 22:01, 22. Aug. 2020 (CEST)

Danke! Bin gespannt auf das Ergebnis. Dürften eigenlich nur wenige Fälle sein (höchstens 10 bis 50 Artikel), aber bei den Zahlen habe ich mich schon öfters getäuscht. Bin darauf gestoßen, als ich heute die letzten PND-Einträge im ANR überprüft und in GND geändert habe.[2] --Kolja21 (Diskussion) 23:38, 22. Aug. 2020 (CEST)

VIAF-Cluster mit mehr als einer GND

@Wurgl: Ich habe gerade das Chaos bei Dietrich Neumann (Architekt, 1929) gelichtet, und dabei ist mir aufgefallen, dass VIAF:66584278 zwei Wikidata-Objekte trotz unterschiedlicher Geburtsjahre in einem Cluster zusammenfasst. Ähnliches habe ich auch schon bei GND-Einträgen in VIAF gesehen. Hast du mal überprüft, um wie viele Fälle es sich handelt? Ich bin neugierig, ob das überwiegend Dubletten sind oder nur Datensätze, die VIAF nicht richtig zuordnen kann. --Kolja21 (Diskussion) 07:26, 8. Apr. 2021 (CEST)

Ich hab das schon öfter gesehen. Bei kurzen Namen von Bands kommt das schon mal vor. Soweit ich mich erinnern kann, war in den Fällen in allen Wikidata-Objekten die VIAF zugeordnet. Die Abrage läuft … seit 12 Minuten *wart* --Wurgl (Diskussion) 08:35, 8. Apr. 2021 (CEST)
4618 VIAFs dieser Art gibt es. Rekord ist VIAF:242677520 mit 11 Wikidata-Objekten. Silke hab ich mal einen anderen "Blumenstrauß" gezeigt VIAF:124541486, einen mit RISM's ;^) --Wurgl (Diskussion) 14:53, 8. Apr. 2021 (CEST)
Danke für die Info, aber wie sieht es mit den Doppeleinträgen von GNDs aus? Das wären die Fälle, die wir vergleichsweise leicht abarbeiten könnten, falls die Zahl der Cluster unter 1000 liegt. --Kolja21 (Diskussion) 20:42, 8. Apr. 2021 (CEST)
19.461 VIAFs, Rekord ist VIAF:13088502 mit 8 unterschiedlichen Hermann Müller. Übrigens: 8.617.067 GND-Ids sind bei der VIAF (8.596.305 VIAF-Ids) und 2.754.066 Wikidata-Objekte (2.748.422 VIAF-Ids).
Ich könnte noch nach solchen filtern, die in der deWP vorkommen. Mal sehen.
Immer noch 1.559 VIAFs, Rekord: VIAF:71367291 mit 4 eventuell identischen Cassius Felix und VIAF:136812647 mit 4 mal Deutscher Kongress für Philosophie. --Wurgl (Diskussion) 23:59, 8. Apr. 2021 (CEST)
und 1.117 vom Typ 'p' :-( @Kolja21: --Wurgl (Diskussion) 00:04, 9. Apr. 2021 (CEST)
Danke! Cassius Felix ist schon mal ein Volltreffer. Wenn der Abschnitt "Mögliche GND-Dubletten, die bisher nicht gemeldet wurden" abgearbeitet ist, wäre es hilfreich, die Treffer vom Typ p in die Liste mit aufzunehmen; die anderen können wir eh nicht melden. --Kolja21 (Diskussion) 00:29, 9. Apr. 2021 (CEST)
Wenn du magst, die VIAFs mit 3 GNDs: VIAF:201437105, VIAF:215456213, VIAF:25384859, VIAF:27268077, VIAF:288838602, VIAF:290218371, VIAF:3288237, VIAF:35209121, VIAF:44578755, VIAF:62340462, VIAF:68994973 --Wurgl (Diskussion) 01:05, 9. Apr. 2021 (CEST)
Ich habe mich erst mal dem Rekordhalter Hermann Müller angenommen: Eine Pseudo-GND individualisiert ( (Q106427760), Aufsichtsratsvorsitzender) und eine Dublette (Hermann Müller, Bankier in Nürnberg) gemeldet. --Kolja21 (Diskussion) 01:28, 9. Apr. 2021 (CEST)
@Wurgl: Die VIAFS mit 3 GNDs dürfte es eigentlich gar nicht geben. Bis auf eine "Familie Walther" sind das fast alles Fälle, wo Name und Lebensdaten übereinstimmen. Da hat der halbautomatische Datenabgleich bei der DNB versagt. Ich habe die Fälle einzeln gemeldet. Eigentlich müsste es reichen, wenn du die Liste mit den 1.117 Dubletten vom Typ 'p' an die GND-Zentralredaktion schickst. Aber leider haben wir es mit einer deutsch-deutschen Behörde zu tun. Bei US-Bibliotheken gibt es mittlerweile ganze Gruppen von Bibliothekaren mit Wikidata-Account. Wenn die DNB nicht aufwacht, werden denen irgendwann die Stellen für Bibliothekare gestrichen, da die Tipparbeit kostengünstig (im Stil von Callcentern) von Fremdfirmen übernommen werden kann. --Kolja21 (Diskussion) 16:48, 9. Apr. 2021 (CEST)
Ich hatte da einen Kontakt an der richtigen Stelle, der ist aber leider erkrankt (näheres auf Anfrage per Email, öffentlich schreib ich das nicht) und ich kenne den Status nicht, Kontakt abgebrochen. Aber wie auch immer, ich fürchte, ich muss da etwas mehr filtern (nicht nur die bereits gemeldeten). Es werden Pärchen genug für einen automagischen Merge übrig bleiben, aber auch ein paar die erst geprüft werden müssen. Nix was von jetzt auf gleich passieren wird. --Wurgl (Diskussion) 19:22, 9. Apr. 2021 (CEST)
Das eilt nicht. Das Schöne an Bibliotheken ist, dass man dort in Dekaden denkt. Aber wo wir gerade bei dem Thema Altlasten sind: Was ist eigentlich aus den Tp6 geworden, bei denen das Feld "Typ Person" fehlt; jene Datensätze, die kurz vor der Entlinkung der Tns erzeugt wurden? (Beispiel GND 156882760.) Bis heute weiß ich nicht, nach welchen Kriterien die Tns ausgewählt wurden, die jetzt als Tp6 ohne weitere Angaben ihr Dasein fristen. --Kolja21 (Diskussion) 20:49, 9. Apr. 2021 (CEST)
Das hier meinst du, oder? Vorlage Diskussion:Normdaten#"14.000 Tn werden zu Tp6" *kopfkratz* Ich hab damals nix gemacht, eben weil kein Ansprechpartner. Raymond so fürchte ich, hat sich wohl auf mich verlassen. Ist wohl dumm gelaufen :-( --Wurgl (Diskussion) 21:10, 9. Apr. 2021 (CEST)
Ich muss gestehen, dass ich dei letzten Monate nicht viel im Bereich Normdaten gemacht habe. Viele andere Projekte und reale Arbeit. Wenn du/ihr mir konkrete Fragen (nochmal?) aufschreibt, leite ich diese gerne an meinen Ansprechpartner weiter. --— Raymond Disk. 21:48, 9. Apr. 2021 (CEST)
@Wurgl: Danke für den Link. @Raymond: Ich überlege mir die wichtigsten Fragen und melde mich morgen. --Kolja21 (Diskussion) 00:05, 10. Apr. 2021 (CEST)

Fragen an die DNB

Hallo @Raymond: Ich habe mir die neue Webseite gnd.network angeschaut, aber keine Antwort auf meine Fragen an die DNB gefunden:

  • Ein Jahr bevor die Tns entlinkt wurde, war die Rede von der Entwicklung eines Tool, das helfen soll, unverlinkte Autoren aufzufinden. Was ist aus dem Projekt geworden?
    • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) Ja, das ist ein Projekt was angelaufen ist. Konzeptionell und in Tests sind wir da weiter vorangekommen, aber es liefert noch keine produktiven Ergebnisse. Das ganze Thema firmiert bei uns unter "Vorschlagssteuerung". Das heißt es sollen Vorschläge für Titel-Personenverknüpfungen entstehen sowie neue Personendatensätze auf Basis von Clusteringverfahren, Datenübernahmen von anderen (GND-)Anwendern. Sobald es da produktive Ergebnisse gibt, werden wir darüber sicherlich auch auf der Webseite berichten.
  • Zahlreiche Korrekturwünsche auf WP:GND/F (z.B. bei neueren Hochschulschriften, die nur noch als Digitalisat archivert sind) gehen auf im Feld 046G genannte Werke (werden nur über OGND angezeigt) zurück, die im Katalog der DNB vorhanden, aber nicht mit einem Autor verknüpft sind. Wäre es möglich, dass die DNB die Verknüpfung automatisiert erledigt?
    • Das betrifft nur die Fällen, in denen ein einzelnes Werk verknüpft ist; bei mehreren muss man erst recherchieren, ob der Tp6 nicht als Tn genutzt wurde. Beispiel: GND 1146587171 = Jörg Kühne (* 1968).
    • Falsche Zuordnung: VIAF:507151246511644130260 = Jörg Kühne (Politiker) + Verfasser von DNB 97246915X
      • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) In 046G werden auch Titel angegeben, die sich nicht im DNB-Bestand befinden. So oder so müssten wir einen maschinellen Abgleich der Angaben aus 046G mit den vorhandenen DNB-Titeldaten machen. Das ist durchaus ein Feld, das wir im o. g. Projekt "Vorschlagssteuerung" berücksichtigen, u. a. deshalb haben wir das Feld auch weiter strukturiert und es nicht bei einem Freitextfeld belassen.
  • Nach welchen Kritierien wurden Tns in Tp6 umgewandelt? (Betrifft rund 14.000 Datensätze.) Offenbar gab es einen "Fehler beim Upgrade der Tns zu Tps" (Wurgl auf Vorlage Diskussion:Normdaten/Archiv/4#"14.000 Tn werden zu Tp6"). Der Typ "Person (piz)" fehlt, daher lassen sich die Neu-Tp6 nicht per GND-Webformular bearbeiten. Diesen Fehler könnte man imho leicht beheben. Beispiel: GND 103328513.
    • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) Die ca. 14.000 Tn-Datensätze der Bibliotheksverbünde BVB und des KOBV wurden maschinell zu Tp6-Sätzen umgewandelt, um deren „Aufbewahrung“ zu gewährleisten. Diese waren ursprünglich lokale vor allem bayerische Namenssätze, die in die überregionale GND abgegeben worden sind. Die Kriterien waren folgende, um lediglich die Datensätze zu selektieren, die vorrangig lokal verwendet wurden: Tn-Sätze mit bayerischem Verbund-ISIL, die Originalschrift enthalten (Menge: ca. 11.100), Tn-Sätze mit bayerischem Verbund-ISIL und mit Feld 667 "Grundbestand" und mit mehr als einem abweichenden Namen und mit Sprachkennzeichen (Menge: ca. 1.300), Tn-Sätze mit bayerischem Verbund-ISIL und mit Feld 667 "Grundbestand" und mit Quelle "Altkarten" (Feld 670) (Menge: ca. 1.500). Diese Datensätze wurden vorher, wenn nicht bereits vorhanden, um Titelangaben ergänzt. Um das Risiko der falschen Titelzuordnungen in den Bibliothekskatalogen zu vermeiden wurden zunächst alle Tn-Datensätze entknüpft. Was noch aussteht ist ein sogenannter Selfmatch (Tp-Datensätze untereinander). Erst danach stehen ggf. weitere Datenmanipulationen an, wie z. B. die Ergänzung des Entitätencodes "piz".
  • Wann werden die Bugs im GND-Webformular behoben? (Es ist weiterhin nicht möglich, alle Berufe, Orte etc. zu verlinken. Bis zu dem Update vor ca. zwei Jahren funktierte die Verlinkung.)
    • Beispiel Berufe: Autor, Bürgermeister, General; Köperschaften: L'Écluse (Paris); Orte: Fès (GND: Fes).
      • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST)Das ist ein bekannter Fehler, der aber leider noch nicht behoben werden konnte. Der Fehler wird durch die Prüfziffer in unseren internen Identifiern verursacht. Dies betrifft nur einen Teil der GND-Datensätze. Dem Datensatz an sich ist vorab nicht anzusehen, ob diese Fehlermeldung erscheint. Bis zur Beseitigung des Fehlers gibt es nur die Möglichkeit, die Freitextfelder zu befüllen.
  • Wann können wir, anolg zu den Tps, auch Körperschaften und Geografika über Wikipedia melden? (In der Kategorie:Wikipedia:Veraltete Normdaten stehen immer noch über 500 Artikel.)

@Wurgl, Silewe, Emu: Streicht oder ergänzt bitte, falls euch noch etwas einfällt. --Kolja21 (Diskussion) 01:58, 14. Apr. 2021 (CEST)

@Kolja21 ich warte nochmal bis Sonntagabend, ob noch weitere Fragen/Anmerkungen kommen, dann gebe ich den Fragenblock weiter. --— Raymond Disk. 14:00, 15. Apr. 2021 (CEST)
@Kolja21 ich habe soeben die Fragen an 3 Leute der DNB weitergeben. --— Raymond Disk. 18:11, 19. Apr. 2021 (CEST)
@Raymond: Danke! Bin gespannt auf die Antwort. Und noch eine Frage: Was ist eigentlich aus der Zusammenarbeit mit der Bayerischen Staatsbibliothek geworden? Wenn ich es richtig sehe, haben die sich das letzte Mal im August gemeldet. --Kolja21 (Diskussion) 18:46, 19. Apr. 2021 (CEST)
@Kolja21 Hmm ja, die BSB.. habe ich wirklich länger nichts von gehört. Frage ich mal nach. --— Raymond Disk. 18:49, 20. Apr. 2021 (CEST)
@Kolja21 Die Antwort auf meine Mail an unsere BSB-Kontaktperson kam heute: "Aktuell, der allgemeinen Lage geschuldet, unterstütze ich auch eine andere Abteilung im Haus. Deshalb ist die Wikipedia-Bearbeitung etwas ins HIntertreffen geraten.
Ich hoffe auf Ihr Verständnis." --— Raymond Disk. 17:22, 28. Apr. 2021 (CEST)
@Kooperation GND-Wikipedia Danke für die Antworten. Ping @Kolja21, @Silewe, @Emu zur Kenntnis. --— Raymond Disk. 20:04, 22. Apr. 2021 (CEST)
Danke! --emu (Diskussion) 20:27, 22. Apr. 2021 (CEST)

Neue Liste [2021]

Hab vorher gesehen, es gibt neuen VIAF-Dump (am Vormittag gabs noch keinen). Momentan lädt der gerade. So in einer/eineinhalb Stunde(n) bau ich die Liste neu. --Wurgl (Diskussion) 16:03, 9. Jun. 2021 (CEST)

Danke für den Hinweis! --Kolja21 (Diskussion) 16:40, 9. Jun. 2021 (CEST)

Es gibt einen frischen Dump der DNB, ich bau mal eine neue Liste. --Wurgl (Diskussion) 14:43, 2. Jul. 2021 (CEST)

… und einen frischen VIAF-Dump. Der lädt gerade. So in einer Stunde gibt es eine neue Liste. --Wurgl (Diskussion) 00:17, 7. Jul. 2021 (CEST)
@Silewe, Kolja21: Ich Dummerchen! Ich hab vergessen die aktuellen Normdaten beim Neugenerieren zu laden. Ich mach am späten Abend eine neue Liste. --Wurgl (Diskussion) 17:20, 9. Dez. 2021 (CET)
@Wurgl: kann passieren :-) Danke für die Info, --Silke (Diskussion) 17:37, 9. Dez. 2021 (CET)