Wikiup Diskussion:Normdaten/Archiv/002

aus Wikipedia, der freien Enzyklopädie
Dieses Diskussionsarchiv hat die empfohlene SeitengröVorlage:SSe erreicht und gilt damit als abgeschlossen. Sein Inhalt sollte nicht mehr verändert werden (ausgenommen Kleinbearbeitungen wie Link- und Vorlagenfixe). Verwende für die Archivierung von Diskussionsbeiträgen bitte das aktuelle Archiv und benutze bitte für aktuelle Diskussionen die aktuelle Diskussionsseite.
Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der Adresszeile deines Browsers, beispielsweise
[[Wikiup Diskussion:Normdaten/Archiv/002#Abschnittsüberschrift]]
oder als Weblink zur Verlinkung auVorlage:SSerhalb der Wikipedia
https://de.wikiup.org/wiki/Wikiup_Diskussion:Normdaten/Archiv/002#Abschnittsüberschrift

VIAF-Infohäppchen

Die Informationen zu VIAF sind relativ spärlich und wenig aktuell: Die Literatur auf http://www.oclc.org/research/activities/viaf/ ist mindestens zwei Jahre alt. Aber ... der Chief Scientist Thom Hickey bloggt unter http://outgoing.typepad.com/ . Spannend. Wobei ich jetzt die in Cool URIs in VIAF beschriebene Redirect-Funktionalität für veraltete VIAF-Cluster-IDs nicht nachvollziehen kann. (Stalin war früher unter http://viaf.org/viaf/95236870 - da werde ich aktuell nicht weitergeleitet, sondern bekomme einen "leeren" Datensatz angezeigt.) -- Make 17:16, 12. Jan. 2012 (CET)

Geht mir leider auch so. Ob das verwandt ist mit dem ähnlichen Problem im DNB-Portal (die Weiterleitung funktioniert erst einige Monate nach der Massnahme, weil vorher der abgeschaffte Satz noch als eine Art Zombie vorgehalten wird (man kann ein Nichts so schlecht an andere Datenbanken kommunizieren). Was auch nicht zu funktionieren scheint, ist das in einem der Blog-Posts angegebene SRU-Interface http://viaf.org/viaf/search : Links lande ich bei "Search" immer auf einer leeren VIAF-Anzeige, rechts bei "Browse" gibt es einen XML-Error... -- Thomas Berger 18:50, 12. Jan. 2012 (CET)
Die Redirect-Funktionalität ist nun repariert: Nach Kontaktaufnahme über die Kommentarfunktion des Blogs bekam ich soeben die Rückmeldung „We finally got it fixed. Looks like this has been a long standing bug involving content-negotiation and HTML display.“. Das heisst, VIAF-Cluster-IDs dürften ähnlich langlebig wie PND-Nummern sein, wobei ich mir allerdings vorstelle, dass es auch Zerschlagungen von Clustern geben könnte, analog dem Aufteilen (des Verknüpfungsinhalts) von Tn-Sätzen auf mehrere Tp-Sätze. -- Thomas Berger 00:42, 3. Feb. 2012 (CET)

Noch ein paar Kleinigkeiten sind im Standardisierungs-Newsletter der DNB erwähnt: Newsletter Nr. 18, Dezember 2011 #viaf. „[Es] werden derzeit 25 Normdateien von 20 Partnern über ein maschinelles Matching-Verfahren miteinander abgeglichen und im Erfolgsfall als Cluster dargestellt. Dabei werden ca. 18 Millionen Normdatensätze und ca. 80 Millionen mit den Normdaten verknüpfte Titeldatensätze abgeglichen. Ergebnis sind ca. 14,5 Millionen Cluster, [...] 2011 wurden erste Abgleiche über Körperschaftsdatensätze gemacht, die Integration von Werktiteln soll in den nächsten Monaten begonnen werden. Die Lieferung aktualisierter und neuer Normdatensätze der PND und GKD erfolgt täglich, die Matching-Prozesse werden monatlich von OCLC aktualisiert.“ – Und: Auch wenn ich nicht alles verstehe fand ich den Newsletter insgesamt aufschlussreich. Man bekommt so zumindest einen ungefähren Eindruck wie weitreichend und abstimmungsbedürftig die derzeitigen Umbauten im Bereich »Gemeinsame Normdatei« sind. -- Make 19:05, 18. Jan. 2012 (CET)

unklare Formulierung

Aufgrund einer Anfrage auf meiner Diskussionsseite ist mir aufgefallen, dass es im Abschnitt "Akzeptierte Normdaten" auch für mich noch unklare Formulierungen gibt:

  1. Teilüberschrift "Hinweise für Personendaten". Personendaten sind in der Wikipedia die biographischen Angaben, welche über die Vorlage:Personendaten in einen Artikel integriert werden. Diese haben aber überhaupt nichts mit den Normdaten zu tun.
    Frage: Was genau im Zusammenhang mit den Normdaten ist gemeint?
  2. Des Weiteren gibt es dort den Hinweis, dass die Identifikatoren auf Individualisierung überprüft werden müssen.
    Frage: Woran erkenne ich die Individualisierung bei LCCN?
    Frage: Woran erkenne ich die Individualisierung bei VIAF? (Dieses ist doch nur eine Linksammlung und kann doch gar nicht individualisiert sein...)

Bin gespannt auf die Antworten. Besten Dank und viele Grüße --Silke 14:05, 26. Jan. 2012 (CET)

Hallo Silke,
  • ad 1. habe ich die Formulierung einmal zu "Normdaten für Personen" umgewandelt. Das reflektiert aber noch nicht, dass Körperschaften seit einiger Zeit ebenfalls über VIAF recherchierbar sind und man noch Vorkehrungen treffen sollte, damit die VIAF-Nummer einer Körperschaft keinen Link zur WP-Personensuche öffnet. Weil alles wg. Umstellung auf die GND bald gründlich überarbeitet werden muss, kann man es m.E. derzeit so lassen (Es fehlt m.E. hier auch noch der Hinweis, wie bei "biographischen" Artikeln zu Künstler-, Autoren-, Heiligenduos und Stiferehepaaren etc. vorzugehen ist, wenn die einzelnen Personen keinen eigenen Artikel haben).
  • ad 2. wird es etwas philosophisch: Zunächst einmal kennt nur die PND überhaupt die Trennung zwischen Personendaten und Namensdaten (für Personen). Ein LCCN-Satz etwa ist per definitionem immer individualisiert, selbst wenn er dieselbe dürftige Information wie ein Tn-Satz der PND enthält (der LCCN-Satz enthält aber eigentlich stets die Information, aufgrund welchen Werks er angelegt wurde, damit ist dann stets festgelegt, welche Person gemeint ist, auch wenn es in der Praxis manchmal schwierig wird zu entscheiden, ob ein anderes Werk oder ein biographischer Artikel genau diese Person meint). VIAF scheint das dadurch in den Griff zu bekommen, dass Namenssätze der PND nur berücksichtigt werden, wenn dazu mindestens ein Titelhinweis mitgeliefert wurde (die DNB hat m.W. auch Titeldaten aus einigen deutschen Bibliotheksverbünden an VIAF geschickt, evtl. gibt es auch OCLC-intern einen kurzen Dienstweg, weil viele Bibliotheksverbunddaten im WorldCat gelistet sind), damit sind also aus VIAF's Sicht Tn-Sätze mit bekannter Nutzung genau so gut oder schlecht individualisiert wie manche LoC-NA-Personensätze. Insofern ist es auch nicht grundsätzlich zu verdammen, die VIAF-Nummer eines Personensatzes in die Normdaten-Vorlage einzutragen, selbst wenn das Cluster nur einen einzigen Bewohner hat und das ein nichtindividualisierter PND-Satz ist, dessen Nummer selbst nicht erfasst werden darf, sondern in die Vorlage:PNDfehlt abzubiegen ist... -- Thomas Berger 14:27, 26. Jan. 2012 (CET)
Danke Thomas, wie immer Schnell und Kompetent beantwortet. Die Antworten zu LCCN und VIAF hatte ich durch meine zahlreichen Einbindungen und den Beobachtungen vermutet, aber eben nicht gewußt. Ich hoffe, dass die Antwort auch anderen Benutzern der Normdaten eine weitere Sicherheit bei der Einbindung der Vorlage gibt. Viele Grüße Silke 14:45, 26. Jan. 2012 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Zusammenlegung der DNB-Normdateien

Hi, wie einige hier vielleicht schon wissen, werden demnächst die PND-, GKD-, EST- und SWD-Normdaten zu einer Normdatei, der Gemeinsamen Normdatei, zusammengelegt werden. D.h. dass es dann z. B. auch keine parallelen SWD- und GKD-Normdatensätze für Ortschaften/Bands/Unternehmen mehr geben wird. h-stt hatte mich auf meiner Diskusssionsseite darauf aufmerksam gemacht, auch weil ich gerade viele SWD-Nummern in Artikel eingefügt hatte, die nach der Umstellung erst wieder per Bot korrigiert werden müssen. Lt. h-stt wird die Umstellung am 19. April erfolgen.

Einige Infos dazu gibt es hier bei der DNB. Ich selbst kenne mich mit den technischen Details dort nicht sehr gut aus, denke aber mal, dass wir hier bei uns einige Veränderungen an der Normdaten-Vorlage werden vornehmen müssen. So wie ich diese dieses PDF (8. Seite) verstehe, werden in der neuen GND weiterhin die verschiedenen Satzarten unterschieden ("Tb für Körperschaften, Tf für Kongresse, Tg für Geografika, Tn und Tp für Personen, Ts für Sachbegriffe und Tu für Werke"). Weiß jemand, wie genau diese Unterscheidung dort dann aussehen wird? Und wie sollten/müssten wir unsere Vorlage bzw. deren Parameter dafür anpassen? Sollten wir in Zukunft nur noch einen Parameter "GND" für alles benutzen, oder wie bisher verschiedene Parameter für verschiedene Satzarten? --Kam Solusar 19:00, 16. Feb. 2012 (CET)

Diese groben Codes werden im Datenformat (MARC21-Authority) in Feld 079 Unterfeld $b codiert werden, siehe Formatdokumentation (p. 6f). Feinere Codes in Form von dreibuchstabigen Kürzeln landen im Unterfeld $v desselben Feldes. Dazu gibt es ein eigenes Dokument zu den Entitätencodierungen. Erst nach der Zusammenfassung der drei Normdateien zur GND wird man beginnen, Dubletten, die durch parallele Führung von Körperschaften in SWD und GKD entstanden sind, zu bereinigen. Dort greift dann aber der auch von der PND bekannte Umlenkungsmechanismus, d.h. die Normdatennummer des abgeschafften Datensatzes leitet weiter auf die des Überlebenden. Insofern besteht hier kein unmittelbarer Handlungsbedarf, es sei denn, es wird auch der Bug überführt, dass diese Umlenkung von URLs im GND-Portal erst sechs Monate nach dem eigentlichen Akt zu wirken beginnt.
Seit einigen Monaten haben wir bereits die Situation, dass in VIAF z.B. auch Nicht-GKD Körperschaften nachgewiesen sind und wir etwa einer Verwendung {{Normdaten|VIAF=123456789}} nicht ansehen können, auf was für eine Sorte Datensatz dadurch verlinkt wird. Das ist m.E. nur ein Problem wegen der mit der Normdaten-Vorlage verschränkten Funktionalität des Übergangs auf die Toolserver-Personensuche.
Beim Versuch, über Interwiki-Links PND-Nummern mit interessanten Vorlagenverwendungen in anderen Wikipedien in Verbindung zu bringen, ist mir allerdings aufgefallen, dass eigentlich nur die deutsche Wikipedia (sowohl wegen der Vorlage:Personendaten als auch über die Kategorie:Person, in der mittelbar alle enthalten sind) das Konzept eines Personenartikels kennt, und Körperschafts-, Geographika- oder Werk-Artikel sind auch hier fremd. Das Feld 079 in MARC21 ist ebenfalls eine GND-Privatangelegenheit (erkennbar an der "9" in der Feldnummer), allerdings sind fundamentale Unterscheidungen zwischen Personen, Körperschaften, Veranstaltungen und einigem mehr sehr explizit an anderen Stellen in alle MARC-Formate eingebaut, so dass gute Aussichten bestehen, dass alle Einzelnormdaten in der Vorlage:Normdaten eines konkreten Artikels von einheitlichem Typ sind und dieser als zusätzlicher Parameter in der Vorlage verzeichnet werden könnte. Das könnte man entweder als willkommene Grobklassifizierung von Artikeln jenseits des Kategorien- und Vorlagensystems der jeweiligen Wikipedia auffassen oder ganz im Gegenteil als unwikipediahaften Schmutz. -- Thomas Berger 21:31, 16. Feb. 2012 (CET)
Hi. Erstmal danke für die Antwort. Die Weiterleitungen bedeuten schonmal, dass wir uns kurzfristig keine Sorgen um die Funktionalität der Links machen müssen. Mittelfristig müssten wir aber versuchen, zusammengelegte Datensätze regelmässig per Bot zu korrigieren.
Wie machen wir das mit der Beschriftung? "GKD in der DNB" einfach umbenennen in "GND in der DNB" o.ä.? Könnte für Leser verwirrend sein, wenn in Artikeln, wo noch GKD und SWD zugleich genutzt werden, dann 2x "GND" angezeigt wird.
Ein Problem ist natürlich der von dir angesprochene Zusammenhang mit dem Personensuche-Tool, das derzeit automatisch bei PND, LCCN oder VIAF eingeblendet wird. Bei einem einzigen "GND"-Parameter für alle GND-Datensätze wäre das nicht mehr möglich. Und auch VIAF-IDs umfassen genau wie LCCNs nicht nur Personen, sondern auch Organisationen, Werke, etc.. Das war IMO bisher der Hauptgrund warum wir LCCN und VIAF nur für Personen-Normdaten genutzt haben. Hier bräuchten wir also wohl eine andere Möglichkeit, die Personensuche möglichst automatissch in Personen-Artikeln zu verlinken. Entweder nutzen wir den schon jetzt existierenden Parameter "WP=1" und lassen ihn per Bot in alle Personen-Artikel einfügen. Oder wir schmeissen den Personensuche-Link ganz aus der Normdaten-Vorlage und lassen ihn z. B. durch die Vorlage:Personendaten einblenden. Oder wir ergänzen die Normdaten-Vorlage wie von dir vorgeschlagen um einen Parameter, in dem der Artikelinhalt grob klassifiziert wird (Person, Werk, Organisation, etc..). Das könnte dann aber recht aufwändig werden, hätte aber den Vorteil, dass man die verschiedenen Arten von GND-, LCCN- und VIAF-Datensätzen einfach unterscheiden und behandeln kann. --Kam Solusar 04:03, 20. Feb. 2012 (CET)
Weil es für ab April neu erfasste Sätze nur eine Nummer geben wird und PND, SWD, GKD dann ja auch offiziell abgeschafft sind, wird die Normdaten-Vorlage für diese Sätze auf jeden Fall zeitnah einen Parameter "GND" bekommen müssen, denn solche Nummern als "PND" etc. einzutragen ist zwar technisch möglich, wäre jedoch ein Anachronismus, den ich auf den Dokumentationsseiten für nur sehr schwer vermittelbar halte. Wenn die (wohl im Juni beginnende) Zusammenfassung von (ex-)SWD- und (ex-)GKD-Körperschaften in der GND abgeschlossen sein wird, dürfte sich hier ein Botlauf empfehlen, der als "GND" die überlebende Identnummer einträgt, der könnte dann auch PND und die restlichen SWD-Parameter umarbeiten. Ich stelle mir vor, dass zur Vorbereitung des Botlaufs alle existierenden Alt-Nummern in der Normdaten-Vorlage maschinell gegen die GND getestet werden, um die aktuelle Normdatennummer zu ermitteln, dabei könnte die Entitätsart direkt mit ermittelt und hinterlegt werden, wenn gewünscht. -- Thomas Berger 15:03, 20. Feb. 2012 (CET)
Also im Groben könnte der weitere Ablauf so aussehen: Zur Umstelllung im April ändern wir schon mal die Beschriftung für PND, GKD, SWD und EST in der Vorlage zu GND und ergänzen einen neuen Parameter "GND" in der Vorlage. Bei Personen dürfte es kaum Redundanzen mit GKD oder SWD geben (ist mir jedenfalls bisher noch nicht begegnet), d.h. dort könnte man eigentlich zeitnah einen Botlauf starten, um PND zu GND zu ändern. Dann die Zusammenfassung der übrigen Normdatensätze durch die DNB abwarten und per Botlauf auf aktuelle GND-Nummer umstellen.
Bin mir nicht sicher, ob man dann irgendwann die veralteten Parameter PND, SWD, GKD und EST ganz entfernen sollte oder sie einfach undokumentiert bestehen lässt und regelmässig durch die korrekte GND-Nummer ersetzt. Es wird ja sicherlich einige Zeit dauern, bis sich die Änderungen herumgesprochen haben.
Ich nehme mal an, beim System der Vorgänger-Körperschaften wird sich nicht viel ändern? D.h. wir müssten die Parameter "GKD-V1" und "GKD-V2" nur durch "GND-V1" und "GND-V2" ersetzen. Das liesse sich dann ja in einem Rutsch beim Botlauf ändern.
Bleibt die Frage: "Typ"-Parameter ja oder nein? Hätte wie oben erwähnt den Vorteil, dass der Link zur Personensuche weiterhin leicht durch Parameterabfrage eingeblendet werden kann und LCCN und VIAF künftig auch bei Nicht-Personenartikeln genutzt werden könnten. Müsste aber vielleicht aufgrund der möglichen Redundanzen mit Kategorien erstmal vor einem größeren Publikum z. B. auf WP:FZW zur Diskussion gestellt werden. Als Alternative fiele mir da nur eine Aufspaltung in Einzelparameter á la "GND-Person", "GND-Körperschaft", etc.. ein. Das hätte aber - soweit ich das sehe - gegenüber einem Typ-Parameter keine großen Vorteile. --Kam Solusar 18:41, 22. Feb. 2012 (CET)
Ich sehe Vorteile: Z.B. kommt man dann mit CatScan besser an die Artikel heran, die den Entitäten entsprechen, für die man sich gerade interessiert (oder kann Inkonsistenzen ermitteln, etwa Schlagwort-Normdaten in Personenartikeln). Ein zusätzlicher Typ-Parameter wäre ausserdem schwerer zu vermitteln, immerhin darf da ja nicht frei Schnauze etwas hineingeschrieben werden. Man kann die Ansätze vielleicht auch kombinieren, Vorlage:Nobel etwa ist eine Master-Vorlage, aus der sich die konkret in den Artikeln erlaubten Vorlagen ableiten. Nach diesem Muster wäre {{Normdaten Körperschaft|...}} einzutragen, das würde intern zu {{Normdaten|TYP=k|...}} aufgelöst (die konkret gewählten TYP-Kürzel bleiben dabei eher "privat" und müssen nicht initial perfekt ausgedacht werden). Ich weiss leider nicht, welche Auswirkungen so eine indirekte Lösung auf die Server-Last hat. -- Thomas Berger 21:45, 22. Feb. 2012 (CET)
Hmm.. an separate Vorlagen hatte ich noch gar nicht gedacht. Da müsste man schauen, wie das mit den Tools und der Weiterverarbeitung hinhauen würde. Ob das womöglich die Serverlast beeinflußt, kann ich leider auch nicht beurteilen. Wenn man bei der einzelnen Vorlage bleibt könnte der Parameter auch per regelmässigem Botlauf eingetragen und gewartet werden. Oder man könnte Artikel per Abfrage in eine Wartungskategorie eintragen, falls ein nicht vorgegebener Parameterwert eingefügt wird. Ich persönlich hab aber mit Parameter u. ä. meist keine großen Probleme, aber ich kann mir schon vorstellen, dass es für viele andere User womöglich einfacher ist, sich nicht mit einem zusätzlichen Parameter rumzuschlagen. --Kam Solusar 04:46, 26. Feb. 2012 (CET)
Zu den anderssprachigen Wikipedias: Mindestens die per Interwiki auf Hilfe:Personendaten eingetragenen Wikipedias kennen sehr wohl das Konzept eines Personenartikels. Ein Unterschied wird jedoch darin bestehen (ich kann jetzt nur von en reden), dass die Vorlagen dort nicht so konsequent eingetragen werden wie bei uns. Eine etwas andere Strategie verfolgt die italienische Wikipedia mit dem it:Template:Bio, das, so weit ich weiß, in jeden Personenartikel eingebunden wird, aber gleichzeitig auch den Einleitungstext des Artikels (!) formuliert. --Mai-Sachme 10:00, 20. Feb. 2012 (CET)
Bei en hatte ich (nur die diversen Infoboxen zu verschiedenen Personentypen bemerkt und dabei) das Persondata-Template mit fast 1.000.000(!) Einbindungen übersehen, bei fr hingegeen sind es nur 392 Vorlageneinbindungen, das kann man dann eher vergessen. -- Thomas Berger 15:03, 20. Feb. 2012 (CET)

Seit einigen Tagen hat die GND die Arbeit aufgenommen. Wie steht es mit einer entsprechenden Änderung in der Wikipedia? Monsieur Becker (Diskussion) 18:22, 27. Apr. 2012 (CEST)

Habe den ersten Schritt, wie oben besprochen, getan: Die Ergänzung des neuen Parameters "GND" in der Vorlage:Normdaten, getestet an unserem Standardbeispiel: Joachim Ringelnatz. Bevor die GND regulär genutzt wird, müsste allerdings noch jemand die anderen Parameter durchtesten und die Einfügung der Trennungen (senkrechter Strich) ergänzen. Gruß --Kolja21 (Diskussion) 04:23, 28. Apr. 2012 (CEST)

Der PICA-Link muss bei der GND entfallen (Beispiel: Regensburger Verbundklassifikation), aber damit, denke ich, kann man leben, da der verlinkte Katalog veraltet ist. --Kolja21 (Diskussion) 04:47, 28. Apr. 2012 (CEST)

PS: Zu Klären wäre auch die Frage, wie die Rückverlinkung vom OPAC der DNB auf die GND funktioniert. --Kolja21 (Diskussion) 05:22, 28. Apr. 2012 (CEST)
Die Rückverlinkung erfolgt aufgrund einer auf dem Toolserver bereitgestellten Datei, bei deren Generierung muss natürlich berücksichtigt werden, dass es nun neben den Parametern "PND", "GKD" und "SWD" auch "GND" gibt.
Wir haben immer noch nicht geklärt, wie wir den Informationsverlust auffangen können, der dadurch entsteht, dass nicht mehr "PND", "GKD" und "SWD", sondern nur "GND" beschickt werden wird. Für die aus der Vorlage generierte Anzeige könnten wir aber ohne Probleme kurzfristig statt "PND" nun "GND (Person)" zeigen ("GKD", "SWD" analog). -- Thomas Berger (Diskussion) 18:35, 29. Apr. 2012 (CEST)
Die Anzeige würde ich nicht ändern, sondern nach und nach auf GND umstellen. GKD und SWD bestehen ja de facto noch getrennt weiter, bis die Dubletten zusammengeführt sind. Um den Informationsverlust aufzufangen, müsste man die Entitätencodierung (pif-pxs = Person) abfragen. Ist das technisch möglich? Bislang konnte man die Zuordnung an den Nummernblöcken erkennen; eventuell hilft auch das weiter. --Kolja21 (Diskussion) 22:29, 29. Apr. 2012 (CEST)
Sehe ich etwas anders: Die Ansetzungen sind ja bereits auf ein einheitliches Schema umgebaut, es steht noch eine Dublettenbereinigung in der GND an. Ab Juli wird es von der Lizensierung her möglich sein, Originaldaten der GND hier zu nutzen. D.h. theoretisch könnte dann ein zu programmierender Bot "Entitätsnachträge" durchführen (eher mit Rückgriff auf die groben Codes: p/n/b/g/ etc.), ober hingegen der Bearbeiter eine Person gemeint hat wird eher an der Existenz der Personendaten im Artikel klar. Mir ist jedenfalls etwas unbehaglich zumute bei der Vorstellung, dass erst ein zeitnaher Botlauf einen Abgleich der Normdaten gegen die GND durchführen soll, bevor auch die Wikipedia-Daten wissen, was los ist (dieser Satz bezog sich auf neu eingetragene Normdaten-Vorlagen hier, nicht auf unseren bis April gewachsenen Altbestand). Die getrennten Nummernkreise sind meines Wissens mit dem Umstieg auf die GND für neue Datensätze (in der DNB) ebenfalls abgeschafft, d.h. wir können einer Nummer nicht einmal ansehen, ob sie für einen Norm- oder einen Titeldatensatz steht. -- Thomas Berger (Diskussion) 00:16, 30. Apr. 2012 (CEST)
Aber wie sollen wir vorgehen? Die GND brauchen wir und die alten Einträge werden wir so schnell nicht los. Daher müsste man ein Übergangsszenario entwerfen, das es erlaubt, vorübergehend wahlweise GND oder PND zu verwenden. --Kolja21 (Diskussion) 01:35, 30. Apr. 2012 (CEST)

Hallo. Ich geb mal meinen Senf dazu ab. Zunächst: mit SWD/GKD kenne ich mich nicht so aus. Fakt ist aber, dass durch die Zusammenlegung ein wenig Info verloren geht, nämlich um welche Form der Entität es sich handelt. Ich bin sehr dafür, diese zusätzlich aufzunehmen, ein knackiger Parametername fällt mir aber nicht ein. Also sowas in der Form (Beispiel Ringelnatz): "GND=118601121|GNDKnackigerName=Tp" (SWD/GKD entsprechend). Das hätte den Vorteil, dass man zusätzliche Links (PICA, Personeninfo) entsprechend des Typs einblenden kann. Und für die alten Parameter: ich halte es für ziemlich unproblematisch diese für eine zunächst unbestimmte Zeit aufrechtzuerhalten. Dabei finde ich aber, dass diese nicht anders angezeigt werden sollten. Um genau zu sein, würde ich sogar die Vorlage entsprechend umbauen. Der Parameter "PND=118601121" wird dabei von der Vorlage übersetzt zu "GND=118601121|GNDKnackigerName=Tp" und dann erst entsprechend angezeigt. Was spricht gegen dieses Vorgehen? Gibt es Gegenvorschläge? --APPER\☺☹ 17:25, 30. Apr. 2012 (CEST)

Ich denke zunächst, die internationalen Normdateien stimmen konzeptionnel weit genug überein, so dass wir "Person" bzw. "Körperschaft" oder "Schlagwort" an der Vorlage festmachen können (und nicht speziell auf den "GND"-Parameter beziehen sollten). Weiter oben in diesem Abschnitt hatte ich vorgeschlagen, mit einer Master-Vorlage "Normdaten" zu arbeiten, die einen Parameter "EherBräsigerName=p" bekommt (etwa "TYP=...", Default-Bestimmung anhand der auslaufenden Parameter PND, GKD, SWD). Für diskussionswürdig halte ich immer noch den Vorschlag, analog Vorlage:Nobel davon trivial abgeleitete Vorlagen Normdaten Person einzurichten: M.E. ist das für Neu- und Gelegentlich-Bearbeiter weniger kryptisch und dürfte auch günstig sein für Selektionen, Plausibilitätstests und die retrospektive Umwandlung der Altnutzungen der Vorlage. -- Thomas Berger (Diskussion) 22:11, 30. Apr. 2012 (CEST)

Mir graust davor, die Vorlage in "Normdaten (Person)" und "Normdaten (xyz)" aufspalten, da wir ja auch noch die Vorlage:DNB-Portal und die ganzen Altlasten haben. Dazu kommen die zahlreichen Interwikilinks, denn es wäre schön, wenn nicht jede Sprachversion ein eigenes System entwickeln würde. Daher schließe ich mich Appers Vorschlag an. Es gibt den Parameter CODE, dessen Anfangsbuchstaben wir in die Vorlage aufnehmen können: g (Geografika und Gebäude), k (Körperschaften), p (Personen), s (Schlagwörter etc.), v und w. Was die Buchstaben bedeuten, muss niemand auswendig lernen; man übernimmt sie aus dem DNB-Katalog und fertig. --Kolja21 (Diskussion) 23:39, 30. Apr. 2012 (CEST)

Für mich wäre es immer noch die Vorlage:Normdaten, sie hätte dann nur bearbeiterfreundliche "Interfaces". Aber wir können die Überlegungen gerne beiseite lassen und uns auf das wirklich zu Klärende konzentrieren:
  1. Soll der einzuführende TYP-Parameter sich auf die GND beziehen (GND=123|GNDKnackigerName=[T]p) oder auf den Wikipedia-Artikel / Übereinstimmende Meinung aller Normdateien (GND=123|TYP=p[erson])? (Wir brauchen den Typ nicht für das wie, also etwa um die GND vernünftig anzusteuern, sondern nur um zu wissen, was für eine Entität insgesamt vorliegt und was man damit machen könnte)
  2. Können wir in einem Aufwasch in die Normdaten-Vorlage eine gewisse Unterstützung für redaktionelle Arbeiten aufnehmen, also i.W. das, wozu wir derzeit die immer obsoleter werdende Vorlage:PNDfehlt nutzen: Vermerk, dass es sich (hier speziell GND-bezogen) um einen Namenssatz handelt, Vermerk (auch GND-bezogen?) wann in der Normdatei vergeblich / nur teilweise erfolgreich gesucht wurde und - sparsamst - einen Freitextkommentar um etwa festzuhalten, dass eine bestimmte Nummer für einen bestimmten Parameter bewusst nicht eingetragen wurde, weil damit folgendes wenig offensichtliches, aber ernstes Problem besteht (etwa Personenvermengung, subtil die falsche Person, ... So etwas steht derzeit meist als HTML-Kommentar hinter der Vorlage). -- Thomas Berger (Diskussion) 23:59, 30. Apr. 2012 (CEST)
Das ganze mit weiteren Vorlagen zu erschlagen halte ich auch für nicht so gut. CODE oder TYP ist super, gerne auch nicht "Tp" sondern allgemeiner halt "p" und "s" etc. Wo genau findet man da eine Liste bei der DNB? --APPER\☺☹ 23:51, 30. Apr. 2012 (CEST)
Wikipedia reicht Dir nicht? Dann guggstu hier 079$b. -- Thomas Berger (Diskussion) 00:03, 1. Mai 2012 (CEST)
Entitätencodierung. Und zu Thomas: Punkt 2 klingt super (Vorlage:PNDfehlt integrieren). Bei Punkt 1 würde ich mich an den Code/Typ der GND orientieren, sonst mischt man zwei Systeme und muss neue Regeln aufstellen. --Kolja21 (Diskussion) 00:21, 1. Mai 2012 (CEST)
Was wäre, wenn wir TYP=n eintragen könnten? Einerseits ist das eine Codierung, die einen tatsächlich nur in der GND vorkommenden Sachverhalt abbildet, andererseits ist klar, dass es die anderen Normdateien "TYP=p" nennen würden. Einerseits sind manche Namen so aussergewöhnlich und die verzeichnete Literatur so einschlägig, dass so ein Namenssatz ohnehin ein Personensatz ist (der davon nur noch nichts weiss), und andererseits wird es noch schwieriger werden anderen Benutzern zu erklären, dass es nix taugt eine Nummer einzutragen, die für ein ganzes Schock Peter Müller steht... Es fehlt irgendwie ein Mechanismus, der zwischen "guten" Tn (= bei WP:PND/F eingetragen) und solchen mit Handlungsbedarf unterscheidet... -- Thomas Berger (Diskussion) 00:45, 1. Mai 2012 (CEST)
Du meinst "n" für Name = nicht individualierter Datensatz? Als Ersatz für die Vorlage:PNDfehlt halte ich das für einen guten Vorschlag. (Ich habe gesehen, dass viele Autoren den "PNDehlt-Hinweis" mittlerweile direkt in die Normdaten eintragen.[1]) Wenn man in der Vorlage den Typ/Code eintragen soll, stößt man automatisch auf das Problem, dass bei Peter Müller nur "Name" steht, aber kein "Typ" angegeben ist. In diesen Fällen sich für "n" zu entscheiden, müsste vermittelbar sein. --Kolja21 (Diskussion) 01:41, 1. Mai 2012 (CEST)
Ja, ich hatte mit der Überlegung testen wollen, wie weit "an den Code/Typ der GND orientieren" tragfähig sein könnte. Denn in Fortsetzung der bisherigen Praxis dürfte man in diesem Fall ja den GND-Parameter nicht nutzen, sondern müsste den Sachverhalt anderswo darstellen.
Wie ist es eigentlich bei geschachtelter Vorlagennutzung: Kann ich in einem hypothetischen Kommentarparameter der Normdaten-Vorlage eine weitere Vorlage nutzen, die dann etwa eine Wartungskategorie setzt? Etwa
  {{Normdaten|LCCN=...|comment= {{NDfehlen|NAME=GND|DATE=1. Mai 2012|GND=1234|PNDF=Eingetragen}}, VIAF uneindeutig}}
Diese Vorlage:NDfehlt dürfte dann natürlich als Anzeige keine Box generieren, sondern nur etwas Fliesstext. -- Thomas Berger (Diskussion) 09:27, 1. Mai 2012 (CEST)

Forts. weiter unten --Kolja21 (Diskussion) 14:56, 3. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

WorldCat-Link für Friedrich Wencker-Wildberg

Hallo, bin mir nicht ganz sicher, ob ich mit der Frage hier richtig bin. Im Artikel Friedrich Wencker-Wildberg habe ich eben die LCCN ergänzt. Die verlinkt auch richtig, aber der Worldcat-Link funktioniert nicht, obwohl es einen Eintrag gibt. Was muss man tun, damit der Link funktioniert? Danke und Gruß, --NiTen (Discworld) 20:03, 20. Feb. 2012 (CET)

So, sollte jetzt funktionieren, die LCCN war nicht ganz korrekt. Du musst die Null(en) unmittelbar nach den Jahreszahlen immer streichen. Hier ist alles schön erklärt, was du wissen musst. --Mai-Sachme 20:10, 20. Feb. 2012 (CET)
Danke. Aber der Worldcat-Link funktioniert trotzdem nicht, oder? --NiTen (Discworld) 20:36, 20. Feb. 2012 (CET)
Da ist irgendeine Unordnung: Betrachten in VIAF ("history of record ...") zeigt, dass der Satz letztes Jahr ausgetauscht wurde. Unter http://www.worldcat.org/identities/lccn-nr89-445 werden einige weitere Werke von Wencker nachgewiesen, dabei ist allerdings die alte Zuordnung nr89000445 der LoC-Satz zum Pseudonym Wilhelm Recken (nach LoC-Regeln ist das eine "bibliographische Identität", also nicht unbedingt als zu bereinigende Dublette anzusehen). Der Wencker-Satz hat zudem die Kennung "rda", ist also experimentell nach zukünftigem Regelwerk gebildet worden, mag sein, dass Worldcat ihn deshalb nicht berücksichtigt: Das könnte die Fehlermeldung erklären (oder Worldcat-URLs funktionieren generell nur für Nummern, für die Woldcat mindestens einen Titel nachweist, das weiss ich leider nicht). Vor allem aber: auch der 2011-er LoC-Satz hat keine Spur von "Wildberg", insofern könnte WorldCat die Titel unter diesem Namen sowieso nicht zuordnen, das erklärt dann, warum sie unter einer URL zu finden sind, die den Namen codiert (/np-wencker%20wildberg,%20friedrich) statt einer LoC-Nummer. -- Thomas Berger 22:25, 20. Feb. 2012 (CET)
Ich versuche mal eine Antwort auf die ursprüngliche Frage: "Schwierig": Der Worldcat-Link wird aus der hinterlegten LCCN abgeleitet, wenn da nichts kommt, ist es Pech (alle Literatur wird dort auch nie zu finden sein, Worldcat ist ja eine Sammlung recht heterogener Daten, die sie zum grossen Teil erst nachträglich mit Normdaten in Verbindung bringen). Ein Benutzer hat letztes Jahr einen undokumentierten Parameter WORLDCATID in die Vorlage eingebracht, gedacht wohl für den Fall, dass keine LCCN existiert, aber dennoch unbedingt auf den WorldCat verlinkt werden muss. Damit könntest Du den Link retten. Allerdings scheint es so zu sein, dass die Worldcat-URLs entweder über die LCCN oder über den Namen gebildet werden, Eintrag eines Namens für die Worldcat-Verlinkung kann daher spontan aufhören zu funktionieren, wenn im Worldcat die Identifikation mit einem LoC-Satz stattfindet (es handelt sich nicht wirklich um "Permalinks"). -- Thomas Berger 22:49, 20. Feb. 2012 (CET)
Alles klar, danke für dein Feedback. Das Einfügen der WORLDCATID funktioniert nicht. Dann belasse ich es beim status quo. Viele Grüße, --NiTen (Discworld) 08:29, 21. Feb. 2012 (CET)
Soeben ausprobiert: Es funktionieren
  1. |WORLDCATID=np-wencker%20wildberg,%20friedrich
  2. |WORLDCATID=lccn-nr89-445
beide sind "korrekt" (und liefern komplementäre Literatur). Den "Status quo" finde ich allerdings auch in Ordnung. -- Thomas Berger 08:39, 21. Feb. 2012 (CET)
Nach der ersten Tasse Kaffee geht es doch! :) Hatte natürlich vergessen, die Leerzeichen zu codieren. Danke, hab es jetzt eingebaut. Einen guten Start in den Tag dir! --NiTen (Discworld) 08:44, 21. Feb. 2012 (CET)
Als Ergänzung: (a) Unter http://www.mediawiki.org/wiki/Help:Magic_words#URL_data ist die Funktion {{urlencode |PATH}} aufgeführt. Die könnte man ggf. verwenden. (b) Bei http://viaf.org/viaf/37440404/ funktioniert in diesem Fall der WorldCat-Link (im Abschnitt "About") auch nicht. – Nur falls noch eine Meinung dazu gewünscht ist. (Ich hatte schweigend mitgelesen und gestern auch ausprobiert.) Die WorldCat-Identities tragen einen "beta-Stempel" und auch unser Vorlagenparameter "WORLDCATID" ist nicht offiziell. Es ist nicht absehbar, was sich noch ändern wird aber ich vermute mal, dass WorldCat (natürlich) statische, permanente URLs anstrebt. So schön die WorldCat-Seiten in vielen Fällen sind, sollte man sich derzeit nicht verpflichtet fühlen, die Normdaten-Links zu WorldCat zu reparieren. – Experimentieren und neue Erkenntnisse sind natürlich sehr willkommen ;-) daher Danke für die Anfrage nebst Diskussion dazu. -- Make 09:12, 21. Feb. 2012 (CET)
Ich selber halte wenig von der Worldcat-Verlinkung, so wie sie jetzt ist: Im Rahmen der Vorlage:Normdaten sehe ich dasselbe Gemurkse wie seinereit mit der Vorlage:PND, das sich auch erst aufgelöst hat, als die Zusatzfunktion "Nachweis interessanter Daten vermöge diesem Identifier" als eben solche erkannt und dann als Vorlage:DNB-Portal abgespalten wurde. Aber letztere taugt natürlich nur für die intellektuell kontrollierte Verlinkung auf einen konkreten Katalog. Wir haben die ISBN-Suche und die Personensuche auf dem Toolserver als Kandidaten bzw. Anschauungsmaterial, wie man - auf einer nachgelagerten Seite - ein "zeig mir alles interessante im Bereich XY dazu" realisieren könnte. Dort wäre dann auch Spielraum, VIAF wirklich zu nutzen, d.h. z.B. im Hintergrund mit der PND- oder VIAF-Nummer VIAF zu konsultieren, dort eine SUDOC/idref.fr-ID zu finden und damit dann eine "Recherche" im SUDOC-Katalog anzubieten. Oder eben zu live entscheiden, ob man die Worldcat-Überleitung mit LCCN oder Namen in der URL realisieren muss... -- Thomas Berger 16:11, 21. Feb. 2012 (CET)
So ganz glücklich bin ich mir dem Worldcat-Link auch nicht, da hier ein einzelner Link gegenüber anderen möglichen Linkzielen recht prominent herausgestellt wird, obwohl die inhaltliche Qualität nicht immer unbedingt WP:WEB entspricht. Vielleicht wäre es da eine Lösung, wenn APPER einen Link zu Worldcat in seinem Personensuche-Tool aufnehmen könnte. Analog zu {{DNB-Portal}} könnte man auch eine Worldcat-Vorlage (wie etwa en:Template:Worldcat id oder en:Template:Worldcat) erstellen, um bei Bedarf in den Weblinks gezielt darauf verlinken zu können. --Kam Solusar 19:54, 22. Feb. 2012 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Schade...

Schade, dass hier alles so kompliziert "erklärt" wird. Die Links führen (fast) alle nur zu weiteren Wikipedia-Artikeln, durch die man sich erst mal durchlesen muss, bis man mit viel Glück wieder einen Link findet und schließlich bei einem Formular landet, wo man wirklich was eingeben kann. Auf dieser Diskussionsseite sieht man ja auch m.E., dass sich nur Spezialisten damit auskennen. Kein Wunder, dass die anderssprachigen Wikipedien dieses seltsame Gebaren nicht mitmachen. Die einzige sinnvolle Anwendung, für die das gemacht wird, scheint ja die künftige Herausgabe einer DVD zu sein, da vielleicht kommt oder auch nicht. Wenn man einen biographischen Artikel schreiben oder übersetzen will, wird einem hier die Arbeit nur unnötig erschwert. Und dann wundert man sich, dass kaum neue Autoren kommen. Ich schlage vor, die Pflicht zum Einstellen von Normdaten in biographischen Artikel einfach abzuschaffen. --R. la Rue (Diskussion) 21:01, 13. Mär. 2012 (CET)

Wo steht etwas von einer Pflicht? --Mps (Diskussion) 21:28, 13. Mär. 2012 (CET)
R. la Rue, stimme Dir zu, dass die Dokumentation leicht konfus ist. Liegt daran, dass die Materie tatsächlich etwas kompex ist und sich schnell Betriebsblindheit einschleicht, wenn man sich intensiver damit beschäftigt. Wenn Du Dich nicht mit den Normdaten befassen möchtest, dann lass sie einfach weg. Ansonsten schreib mal, an welcher Stelle Du "steckengeblieben" bist. Wenn Du konkret nach den Normdaten für einen Artikel suchst, dann frag formlos unter Hilfe Diskussion:Normdaten nach. ZB: „Ich brauche Hilfe bei den Normdaten für Artikel Xy. Kann mir jemand erklären, was ich da wo eintragen muss? Alles was ich herausfinden konnte ist ... Aber damit komme ich nicht weiter.“ Am konkreten Beispiel versteht man meist einfacher, wie es läuft. Grüße -- Make (Diskussion) 23:58, 13. Mär. 2012 (CET) PS: mich würde noch interessieren, was Du mit „und schließlich bei einem Formular landet“ meinst. – Schnarks Normdaten-Skript? – Achso, ein Beispiel für den konkreten Nutzen der Normdaten ist zB der Katalog der Deutschen Nationalbibliothek. Der Datensatz zu Albert Einstein unter http://d-nb.info/gnd/118529579 hat rechts einen Link "zugehöriger Artikel in Wikipedia". Dieser Link entsteht automatisch durch den Wikitext {{Normdaten|TYP=p|GND=118529579}} in Albert Einstein.
automatisch? Wie funktioniert das denn? 79.192.100.7 22:49, 13. Apr. 2012 (CEST)
Es gibt da eine Verabredung zwischen "Wikipedia" und DNB. Danach (siehe Hilfe:PND#Download und Verlinkung auf die Wikipedia wird täglich auf dem Toolserver eine Auswertung der Normdaten-Vorlage vorgenommen und unter [2] bereitgestellt. Die DNB wiederum zieht sich täglich diese Datei und inkorporiert sie in ihre Suchoberfläche "DNB-Portal" (nicht in die eigentlichen, bibliothekarischen Datensätze). Wird dann dort ein in der Liste erwähnter Datensatz zur Anzeige gebracht, erscheint rechts von ihm der "Wikipedia-Link". - Thomas Berger (Diskussion) 23:19, 13. Apr. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Detail: fehlender Link zur Wikipedia

Hier http://d-nb.info/gnd/134400070/about/html, beim Eintrag des Flötisten Eckart Haupt fehlt der Link zur Wikipedia in der DNB. Bei den anderen Artikeln funktioniert er m.E., nur hier nicht. --Cholo Aleman (Diskussion) 10:35, 27. Apr. 2012 (CEST)

Normdatennummer hier nun auf http://d-nb.info/gnd/104033479 aktualisiert. -- Thomas Berger (Diskussion) 11:28, 27. Apr. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

GND

Forts. von Disk. "Zusammenlegung der DNB-Normdateien". --Kolja21 (Diskussion) 15:00, 3. Mai 2012 (CEST)

Was machen wir jetzt mit unseren zigtausend PND-Eintragungen, nachdem uns die Nationalbibliothek da einfach mal so den Boden unter den Füßen wegzieht und unnötigerweise alles umbenennt? Sollen wir die Vorlage auf die Anzeige von "GND" umstellen auch für alle als "PND" eingetragenen Nummern? Sollen wir ernsthaft alle Artikel ändern und PND= auf GND= umstellen (das heißt auch Umprogrammieren der Helferlein). Oder nur für neue GND= eintragen? Oder uns für Personen diesem ganzen Mist verweigern und einfach weiter PND= eintragen? Aus der Diskussion oben werde ich nicht schlau, ich wüsste gerne, wie wir jetzt im Moment beim Neueintragen von Normdaten verfahren sollen. Die ersten Leute tragen nämlich schon GND statt PND ein, und wenn die nicht weiter als Ex-PND gekennzeichnet sind, geht ja eine Information verloren (außerdem funktioniert mit diesen Eintragungen die normdaten-Eintragung per js-Script nicht mehr). --AndreasPraefcke (Diskussion) 09:48, 3. Mai 2012 (CEST)

Die DNB hat das Projekt Gemeinsame Normdatei über Jahre hinweg vorbereitet und sinnvoller Weise die URL bereits zu PND-Zeiten entsprechend benannt (http://d-nb.info/gnd/). Dadurch funktionieren unsere Links weiter und wir stehen nicht unter Zeitdruck. Die GND habe ich in der Vorlage:Normdaten eingetragen (damit niemand auf die Idee kommt, die PND als veraltet einfach zu löschen). "Hilfe:PND" wurde ebenfalls bereits ergänzt und nach Hilfe:GND verschoben. Jetzt sind Experten wie Apper gefragt, die die Vorlage:Normdaten durch einen Parameter so erweitern, dass die GND vollständig die alten Normdateien (PND, GKD und SWD) ersetzen kann. Zzt. kannst du also problemlos weiter die PND verwenden. --Kolja21 (Diskussion) 15:34, 3. Mai 2012 (CEST)
Und wenn jemand schon GND einträgt die belassen? Oder lieber beim Eintragen anderer Korrekturen/Daten wieder vorerst auf PND zurückändern, bis ein Bot dann alles macht? --AndreasPraefcke (Diskussion) 15:58, 3. Mai 2012 (CEST)
Die Normdaten-Vorlage ist ohnehin stark personen-lastig (habe vorhin einen Eintrag mit GKD- und VIAF-Nummer gemacht und dennoch einen Link auf die Personensuche bekommen ;-). Die Diskussion oben zeigt war noch keine Ergebnisse, aber immerhin die Tendenz, dass die Normdaten-Vorlage etwas stärker als minimal nötig überarbeitet werden sollte. Wie Kolja richtig bemerkt hat, stehen wir nicht furchtbar unter Zeitdruck, die Vokabel "PND" ist noch nicht völlig in Vergessenheit geraten. Das schlimmste was momentan passieren kann, ist dass ein paar Nummern zu viel oder zu wenig in den täglichen Nummernausspeicherungen landen und dass nach dem Festzurren der Normdaten-Vorlage ein paar wenige Vorlagenverwendungen als "Codierung fehlt" in einer Wartungskategorie aufscheinen werden. my 2c -- Thomas Berger (Diskussion) 16:50, 3. Mai 2012 (CEST)
@Andreas: Die GND kann und darf gerne bereits verwendet werden, auch wenn sie vorerst noch die Ausnahme bleiben wird. (Beispielsweise ist es retrospektiv schwer zu ermitteln, ob eine GND-Nummer eher der GKD- oder SWD-Vorlage zuzuornden ist.) Wenn die Normdatenvorlage optimiert ist, müssen wir eh eine Liste erstellen, in der die GNDs aufgeführt sind, die noch keinen Typ/Code-Vermerk haben (bzw. die erwähnte Wartungskategorie nutzen). Bis dahin läuft alles wie gehabt weiter. --Kolja21 (Diskussion) 18:31, 3. Mai 2012 (CEST)
Danke für die Antworten. --AndreasPraefcke (Diskussion) 11:51, 6. Mai 2012 (CEST)

Ich würde allerdings darum bitten, bei Personen so wenig wie möglich den Paramter GND zu verwenden. 1) funktioniert damit unsere BEACON-Datei noch nicht (und damit All Known Sources etc.) und 2) muss man die Sätze ja eh nochmal anfassen, um dann in irgendeiner Form den Paramter "Person individualisiert" einzutragen. --AndreasPraefcke (Diskussion) 11:25, 8. Mai 2012 (CEST) Gilt nicht mehr --AndreasPraefcke (Diskussion) 14:11, 14. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:11, 14. Mai 2012 (CEST)

GND: Änderungsvorschlag Normdaten-Vorlage

Hallo. Entsprechend der vorherigen Diskussionen fasse ich mal ein paar Punkte zusammen, die dann auch so an die Vorlagenwerkstatt übergeben werden könnten. Den Vorschlag einen comment-Parameter einzuführen habe ich erstmal weggelassen, das ist ja unabhängig von den GND-Änderungen. Also hier zusammengefasst, wie ich mir das vorstelle.

  • Die bisherigen Normdateien PND, GKD und SWD wurden zur neuen gemeinsamen Normdatei GND zusammengefasst.
  • Entsprechend sollen die Parameter der Vorlage:Normdaten angepasst werden: Neuer Parameter (wurde schon hinzugefügt) ist "GND"
  • Neu hinzugefügt werden soll ein Parameter TYP, in den die Art des behandelten Artikelinhalts codiert werden soll (z.B. "p" für Personen, "g" für Geografika, "s" für Schlagwörter, "k" für Körperschaften). Eine Liste wird dann erstellt (entsprechend der DNB), eine Anzeige des Parameters ist erstmal nicht nötig.
  • PND, GKD und SWD sollen nicht mehr angezeigt werden. Stattdessen ist "PND=123" ein Kürzel für "GND=123" und "TYP=p" (Personen). Ähnliches gilt für GKD ("TYP=k") und SWD ("TYP=s").
  • Der Link auf "Wikipedia-Personeninfo" soll nur angezeigt werden, wenn der TYP=p.

Ich bitte um Kommentare. Außerdem stellt sich die Frage: was passiert mit den Parametern GKD-V1 und GKD-V2? Wird der Parameter EST noch verwendet? Wurde der auch ersetzt durch die GND? --APPER\☺☹ 13:44, 5. Mai 2012 (CEST)

Die Ex-GKD-Sätze in der GND sind zum TYP=b (Körperschaften) bzw. TYP=f (Kongresse) bzw. TYP=g (Geographika und Gebietskörperschaften) geworden. Insbesondere Veranstaltungen nicht mehr als Körperschaft aufzufassen entspricht internationalen Gepflogenheiten. Daher wäre ich dagegen, in der Normdaten-Vorlage einen Typ "k" (= "wäre in der GKD, wenn es die noch gäbe") weiterleben zu lassen. Analog für die Teilmenge der Ex-SWD, die aktuell in der GND TYP=s hat: Das wären nur die Sachbegriffe.
Der TYP=u steht für "Werke", er umfasst die Einheitstitel der Musik aber auch die vorher in der SWD als "t" bzw. "p/t" codierten Werke der Literatur und bildenden Kunst (ausgenommene Werke weiterhin: Architektur und Monumentalplastik als TYP=g). Wir sollten hier meiner Meinung nach "EST" streichen (historischer Versuch, die Titel zu normieren) und auf "Werke" umlabeln. -- Thomas Berger (Diskussion) 16:48, 5. Mai 2012 (CEST)
Ah, okay. Das mit den GKD/SWD wusste ich nicht. Also müssen praktisch alle Artikel mit GKD/SWD demnächst mal angefasst werden und klassifiziert werden? Auf jeden Fall kann aber der Parameter PND mit TYP=p bestehen bleiben. Ich fasse also nochmal zusammen:
  • Die bisherigen Normdateien PND, GKD und SWD wurden zur neuen gemeinsamen Normdatei GND zusammengefasst.
  • Entsprechend sollen die Parameter der Vorlage:Normdaten angepasst werden: Neuer Parameter (wurde schon hinzugefügt) ist "GND"
  • Neu hinzugefügt werden soll ein Parameter TYP, in den die Art des behandelten Artikelinhalts codiert werden soll (z.B. "p" für Personen, "g" für Geographika und Gebietskörperschaften, "s" für Schlagwörter, "b" für Körperschaften). Eine Liste wird dann erstellt (entsprechend der DNB), eine Anzeige des Parameters ist erstmal nicht nötig.
  • Die GKD und SWD werden zunächst weiter angezeigt. Hier muss jeweils manuell der korrekte TYP ermittelt werden, die Parameter bleiben also erstmal bestehen (gelten aber als veraltet)
  • Die PND soll nicht mehr angezeigt werden. Stattdessen ist "PND=123" ein Kürzel für "GND=123" und "TYP=p" (Personen).
  • Der Link auf "Wikipedia-Personeninfo" soll nur angezeigt werden, wenn der TYP=p.
So besser? Weitere Einwände? --APPER\☺☹ 22:13, 5. Mai 2012 (CEST)

Sieht gut aus, allerdings würde ich die Anzeige "PND" nicht ändern. Zum einen ist das Kürzel bekannt, zum anderen sieht man dann sofort, welche Vorlage veraltet ist. Zwei Fragen:

  • Wie soll mit den GKD/SWD-Dubletten umgangen werden, die uns ja noch eine Weile erhalten bleiben? Zwei GNDs einzutragen, führt zu Verwirrung. Können wir festlegen, dass bei Dubletten eine (welche?) bevorzugt wird?
  • Wie sieht die Abstimmung mit der Vorlage:DNB-Portal aus? Auch dort gibt es den Parameter "TYP". Ist es möglich, den Parameter einheitlich zu verwenden, z.B. "TYP=p" ergibt standardmäßig "Literatur von und über"? Den Parameter "TYP" in der Vorlage:DNB-Portal sollte man entsprechend ändern, z.B. in "TEXT".

--Kolja21 (Diskussion) 23:25, 5. Mai 2012 (CEST)

Ich habe als Vorarbeit schon mal die sechs Hauptentitäten der Gemeinsamen Normdatei in einer Tabelle zusammengefasst: Hilfe:GND#Entitätenliste. --Kolja21 (Diskussion) 04:02, 6. Mai 2012 (CEST)
In dieser Aufstellung entspricht die Spalte "Aleph" dem ersten Zeichen der feineren "Entitäten-Untergliederung" MARC 079$v (nicht belegt für Namenssätze) und die Spalte "PICA" ist der grobe "Entitätentyp" MARC 079$b. Beides ist offiziell und Abweichungen gibt es bei Tn, Tb=k..., Tf=v.. und Tu=w.. Sichtbar im DNB-Portal ist der dreibuchstabige Code (und seine Auflösung). Ich schlage vor, dass der Normdaten-Parameter in den abweichenden Fällen beides Codes erlaubt und ein Bot ab und zu die Sache vereinheitlicht. -- Thomas Berger (Diskussion) 10:56, 6. Mai 2012 (CEST)
Was passiert denn mit den Dubletten? Gibt es da einen Plan bei der DNB, welche erhalten bleiben wird? Zu den Dubletten noch etwas (bei den Personen ist das fast schon ein Euphemismus, oft genug sind es drei bis fünf Tp...): Wie macht denn eigentlich die DNB das bei Zusammenlegungen im Personenbereich? Wenn es da einen klaren Mechanismus gäbe (immer die kleinste Nummer oder alphabestisch erste Nummer bleibt oder so etwas) wäre das natürlich auch für uns hilfreich. Ich hab bisher immer die bevorzugt, zu der Werke in der DNB zugeordnet waren. Bei Dubletten ohne alle Werke die, die mir irgendwie am ältesten vorkam bzw. die, die am allervollständigsten schien... --AndreasPraefcke (Diskussion) 09:07, 6. Mai 2012 (CEST)

Kleinigkeit zu: Der Link auf "Wikipedia-Personeninfo" soll nur angezeigt werden, wenn der TYP=p. Die PND enthielten auch viele Familien (Adelsfamilien z. B.), die jetzt m. W. wiederum als "Person" in der GKD gelandet sind. Beispiel: http://d-nb.info/gnd/118544233 Die müsste man entweder wiederum wie bisher per Paramter WP=0 vom Link auf die Personensuche ausschließen können oder Du nimmst sie alternativ in die Personensuche irgendwie auf. --AndreasPraefcke (Diskussion) 09:03, 6. Mai 2012 (CEST)

Die Vorlage sollte eine Fehlermeldung mit Erläuterung (und zusätzlich Wartungskategorie) auswerfen, wenn GND vorhanden ist und "Typ" vergessen wird. --AndreasPraefcke (Diskussion) 09:03, 6. Mai 2012 (CEST)

Sollten wir bei den nichtindividualisierten nicht endlich einmal von der Vorlage PNDfehlt wegkommen und GND und "Typ p/nichtindividualisiert" oder so etwas einführen? Und vielleicht sogar noch DNBWerkeUnter= für die vielen leeren Tp mit vollen eindeutigen Tn? Das wie oben von Thomas Berger vorgeschlagen als Vorlage innerhalb der Vorlage zu machen, finde ich nicht so toll, da das Auswertungen doch nur wieder unglaublich komplizierter macht, oder? --AndreasPraefcke (Diskussion) 10:48, 6. Mai 2012 (CEST)

DNBWerkeUnter ist doch genau die Vorlage:DNB-Portal? Wenn Tn-Sätze erlaubt werden (aber natürlich als solche gekennzeichnet) ist schon viel gewonnen. Aber weil Tn ja aus unserer Sicht nur ein Zwischenzustand ist, ist der Vermerk eines Datums in diesem Fall sehr wichtig (und evtl. die Tatsache, ob und von wann es einen Eintrag bei WP:PND/F gibt). Für mich stellt sich das so dar, als hätten wir innerhalb der Menge der Vorlagenparameter solche (TYP=n + GND + Datum), die einander sehr stark bedingen und in dieser Situation gemeinsam einzugeben sind. Mein Eindruck ist, dass das bei Infoboxen häufiger vorkommt und da dann meist mit der Technik "Vorlage(neinbindung) in der Vorlage(neinbindung)" geregelt wird. -- Thomas Berger (Diskussion) 11:07, 6. Mai 2012 (CEST)
Klar sollte das im Artikel unter DNB-Portal stehen, ich dachte eigentlich eher daran, dass man dann mit der einen Vorlage sich eigentlich diese ganzen manuellen Meldungen auf PND/F in diesen Fällen sparen könnte. Aber das lässt sich wahrscheinlich automatisch eh nicht fehlerfrei machen. --AndreasPraefcke (Diskussion) 11:42, 6. Mai 2012 (CEST)
Zu den Vorlagenverschachtelungen: Hmm... Solange es außerhalb der Normdatenvorlage keine Verwendung dafür gibt und innerhalb der Normdatenvorlage nur eine jeweils einmalige Verwendung, finde ich das eigentlich nicht sehr sinnvoll, und es wird eben alles immer noch komplizierter einzugeben und zu verstehen. (Und mit einfachen, auch für mich bedienbaren, Tools wie der "Vorlagenausertung" auszulesen). Es ist mir aber eigentlich nciht so wichtig, wenn Du das sinvoll findest, glaube ich dir gerne. --AndreasPraefcke (Diskussion) 11:48, 6. Mai 2012 (CEST)
(Zu beiden vorigen Absätzen) Mir persönlich ist wichtig, die PNDfehlt-Funktionalität in der Normdaten-Vorlage abwickeln zu können, also einen Bearbeitungsschritt, der folgendes umfasst:
  1. Eintrag einer Tn-Nummer statt Tp-Nummer bzw. (impliziten) Vermerk, dass es gar keine sinnvolle Nummer gibt
  2. Vermerk, ob ich zeitgleich einen Eintrag bei PND/F vornehme
  3. Datum dieser Prüfung oder Ergänzung
Daraus können dann Wartungskategorien abgeleitet werden, Wiedervorlagelisten und der nächste, der "unsystematisch" vorbeistolpert sieht u.U. auch, dass er sich nicht kümmern muss (versehentliche Mehrfacheinträge bei PND/F sind m.E. durchaus schon einmal vorgekommen). Baue ich keine Verbindung dieser Elemente über die Vorlagensyntax auf, dann benötigen wir m.E. einen stark normierten Vermerk (etwa "GND fehlt": ein festes "Token" ist aber doch bereits schon fast eine Vorlageneinbindung, nur ohne Flügelchen {{...}}?) um zu erkennen, dass eine fehlende GND-Nummer keine Nachlässigkeit ist. Eine Untervorlageneinbindung hingegen ist m.W. oft günstig für das Setzen von Wartungskategorien etc. (Rekursion erledigt oft viele der umständlich zu notierenden Fallunterscheidungen); für maschinellen Auswertungen der Dumps (und auch CatScan?) wird es schwieriger; ob es ausserdem Performance-Auswirkungen für die Wikimedia-Server hat, weiss ich gar nicht (Habe ich schon erwähnt, dass ich mich mit Vorlagenprogrammierung nicht auskenne?). Finden wir doch einfach die beste Lösung, die die benötigte Funktionalität implementiert ;-) -- Thomas Berger (Diskussion) 12:19, 6. Mai 2012 (CEST)

Das Erhalten von PND mit Auflösung in GND=/Typ=p ist zwar elegant, aber der Erfahrung nach versteht das dann wieder kein Mensch (ähnlich wie heute noch ständig die Vorlage:PND in neue Personenartikel aufgenommen wird...) Wie soll man solche Änderungen erklären, wenn das alte immer daneben weiterbesteht? Es wird dann nur immer noch verwirrender. Ein einmaliger riesiger Botlauf mit Änderung in zwei Parameter wäre da bei allem Aufwand m. E. schon recht sinnvoll. Könnte der dann vielleicht auch gleich irgendwie inzwischen weitergeleitete PND und VIAF-Nummern aufstöbern und korrigieren? --AndreasPraefcke (Diskussion) 09:16, 6. Mai 2012 (CEST)

Ab Juli stehen die Normdaten der DNB unter CC0 (derzeit sind sie noch NC, was eine Verwendung weitestgehend ausschließt), dann wird das juristisch möglich sein. -- Thomas Berger (Diskussion) 11:07, 6. Mai 2012 (CEST)
Heißt das dann auch, das wir (erst) ab Juli automatisiert von GKD/SWD in GND mit Typ überführen können? Naja, solange kann man ja gut warten. --AndreasPraefcke (Diskussion) 11:50, 6. Mai 2012 (CEST)

Kommentar zu vier Stichpunkten:

  • Entitätenliste: Plädiere für Aleph (= "Typ" im DNB-Katalog). Den PICA-Code als Alternative anzubieten, stiftet vermutlich Verwirrung.
  • Dubletten: Die DNB wird sie nach und nach abarbeiten ("mergen"). Ich vermute, dass die SWD der GKD vorgezogen wird, aber es wird auf jeden Fall Redirects geben. (Die zahllosen Personendubletten sind dem Umstand geschuldet, dass Anfang des Jahres die Daten aus den Bibliotheksverbünden eingespielt wurden. Die sollten erst nach der Einführung der GND, also ab jetzt, in zwei Schritten abgearbeitet werden: Erst halbautomatisch, dann Problemfälle und Feinarbeit per Hand.)
  • Vorlage:PNDfehlt ersetzen, d.h. in die Vorlage mit einbauen: Ein klares Ja! (z.B. den Typ "fehlt" aufnehmen)
  • Datum dieser Prüfung oder Ergänzung: Ebenfalls ein klares Ja! (Datumsstempel oder Feld "Letzte Änderung" wäre hilfreich)

--Kolja21 (Diskussion) 22:39, 6. Mai 2012 (CEST)

ad "Typ": Die Regel wäre dann also, in der Normsatzanzeige im DNB-Portal die Zeile "Typ" zu suchen, und den ersten Buchstaben des oder der dreibuchstabigen Codes in runden Klammern zu notieren (es gibt öfters mehrere Codes, der erste Buchstabe sollte aber stets derselbe sein, Bsp. 7559644-1). Die Ausnahme wären Namenssätze, die haben keinen Typ im DNB-Portal und werden wie gehabt an der abweichenden Wendung "Name" statt "Person" vor dem Namen erkannt. Bleibt folgendes zu klären: Wenn der TYP hier nun die Entität als solche kennzeichnet, müsste dennoch "p" eingetragen werden (VIAF und LCCN etc. beträfen ja immer noch die Person) und die Tatsache, dass es sich um einen Tn-Satz handelt, muss in einen anderen Parameter gepackt werden. Oder aber es wird TYP=n eingetragen und die Vorlage weiss dann, dass es sich um eine andere Spielart von "Person" handelt. -- Thomas Berger (Diskussion) 00:19, 7. Mai 2012 (CEST)

O.k. "n" (= Name oder Nein) ist vielleicht eleganter und auf jeden Fall kürzer als "fehlt". Spannend finde ich dein Beispiel, wo drei Typen in einem Datensatz genannt werden. Das macht die Übernahme per Bot schwierig, aber wir arbeiten ja zum Glück im Handbetrieb. --Kolja21 (Diskussion) 01:29, 7. Mai 2012 (CEST)

Der PICA-Link in der Vorlage ist veraltet ("Dieser Katalog wird nicht mehr weiterentwickelt"). Als Alternative bietet sich der OGND-Katalog an.[3] --Kolja21 (Diskussion) 05:42, 7. Mai 2012 (CEST)
Das steht da seit 2009 drüber. Die OGND hat keine Möglichkeit, über den verborgenen Link auf die PICA+-Darstellung umzuschalten, zeigt die Entitätencodes nicht und bietet eine interne Nummer als Permalink an: Das könnte mehr Verwirrung stiften als nützlich sein. -- Thomas Berger (Diskussion) 07:18, 7. Mai 2012 (CEST)
Ich korrigiere ich: Der verborgene Link ist da, nur etwas tiefer als ich ihn erwartetet hatte. -- Thomas Berger (Diskussion) 07:19, 7. Mai 2012 (CEST)
Der OGND-Katalog ist übrigens recht sexy. Wenn ich mir beispielsweise den GND-Eintrag zu Ernst Schnabel anschaue, werden dort auch die alten Normdaten, incl. bereits abgearbeiteter Dubletten aufgeführt:
Ernst Schnabel (1913-1986)
Person, individualisert (GND)
GND-Nummer: 11875856X (Link zu diesem Datensatz in der GND)
Alte Norm-Nr.: 11875856X (in der "pnd" vor der GND-Migration)
Alte Norm-Nr.: 134996275 (in der "pnd" vor der GND-Migration)
Alte Norm-Nr.: 31068627X (in der "dma" vor der GND-Migration)
Alte Norm-Nr.: 4106555-4 (in der "swd" vor der GND-Migration)
Fazit: Die GND ist leichter zu recherchieren als im DNB-Portal und die Datenmaske bietet mehr Infos. Was fehlt, ist der dreistellige Typen-Code, der aber eher verwirrt. Die Angabe "Person, individualisert" ist für unsere Zwecke besser geeignet als "Person (piz)". --Kolja21 (Diskussion) 20:53, 7. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

GND: To-Do-Liste

Hier die Liste der im letzten Abschnitt gesammelten Vorschläge.

Zentrale Aufgaben

  1. Vorlage:Normdaten: die GND durch den Parameter "TYP" ergänzen: Da die Gemeinsame Normdatei (GND) im Gegensatz zur veralteten PND auch Sachbegriffe und Geografika erfasst, sollte die Vorlage durch den Parameter "TYP" ergänzt werden (s. Hilfe:GND#Entitätenliste). "TYP=p" würde beispielsweise die Ausgabe Normdaten (Person): ... erzeugen; "TYP=g" dagegen Normdaten (Geografikum): ....
    1. Pro Falls der Parameter "Typ" fehlt, könnte man die Anzeige "Normdaten: ..." (ohne Klammerzusatz) erzeugen, und die Vorlage mit einem kleingedruckten Hinweistext versehen, in dem Stil: "Bei dieser Vorlage fehlt der Hinweis auf ... Wie man sie verbessert, findest du unter ..." --Kolja21 (Diskussion) 00:39, 9. Mai 2012 (CEST)
    2. (Übernahme von APPER, 5. Mai 2012, s. oben:) Die GKD und SWD werden zunächst weiter angezeigt. Hier muss jeweils manuell der korrekte TYP ermittelt werden, die Parameter bleiben also erstmal bestehen (gelten aber als veraltet).
  2. Was passiert mit den Parametern GKD-V1 und GKD-V2? Wird der Parameter EST noch verwendet?
    1. Vorgängerkörperschaften wird es weiterhin geben, und natürlich nicht nur in der GND kommen sie vor. Strenggenommen braucht man dafür deshalb eine Vorlage:Normdaten-Vorgänger und muss das ständig im Auge behalten, manchmal könnten ja Vorgängerkörperschaften in einen neuen Artikel ausgekoppelt werden (allerdings nie so häufig wie in den Normdateien, wo die Schwere der Namensänderung das wichtigste Kriterium für einen "Split" ist). -- Thomas Berger (Diskussion) 15:03, 9. Mai 2012 (CEST)
    2. "EST" ist nun ein Unterfall von "w" / "u" (Werke) und wird in vielen Normdateien in den nächsten Jahren sehr umfangreich werden. -- Thomas Berger (Diskussion) 15:03, 9. Mai 2012 (CEST)
    3. Bringen die Vorgänger und Nachfolger eigentlich irgendetwas für uns? Reicht es nicht, wenn die in der DNB-Site anklickbar sind? Wozu in der Wikipedia aufnehmen? --AndreasPraefcke (Diskussion) 15:26, 9. Mai 2012 (CEST)
    4. Angesichts der Länge der To-Do-Liste und des Wartungsaufwandes plädiere ich auch dafür, die Parameter wegfallen zu lassen. Wurden sie bislang überhaupt mehr als ein dutzend Mal genutzt? (Hat jemand die Zahlen aus dem Dump?) --Kolja21 (Diskussion) 15:30, 9. Mai 2012 (CEST)
      cf. WD:ND#Parameterhäufigkeit_in_de:WP: 489 bzw. 63 Mal immerhin. -- Thomas Berger (Diskussion) 12:39, 10. Mai 2012 (CEST)
  3. Der Link auf Wikipedia-Personeninfo soll nur angezeigt werden, wenn TYP=p.
    1. Klingt gut. Wie schon mal angemerkt gibt es aber auch Personendatensätze für Familien (vor allem Adel), daher wäre ein Trigger mit WP=0 (der dann auch die Klammer "(Person)" von "Normdaten (Person)" am besten entfernen sollte, noch sinnvoll. Oder aber die DNB entscheidet sich, die Familien zu Organisationen zu machen... (keine Ahnung, wie diese Datensätze in Zukunft behandelt werden sollen) --AndreasPraefcke (Diskussion) 09:04, 9. Mai 2012 (CEST)
      Familien sind in MARC21 im den "Personen" vorbehaltenen Feld 100 angesetzt (vgl. [4]), also auch international eine Spielart von "Person" und insgesamt recht neu (Herkunft m.E. stark der Bereich Nachlässe und Autographen und dort hat ein Familienarchiv wohl mehr mit einem persönlichen Nachlass gemein als mit dem Archiv einer "echten" Organisation). -- Thomas Berger (Diskussion) 15:03, 9. Mai 2012 (CEST)
    2. Familien haben den Code "pif", gehören für die GND-Redaktion daher zu der Gruppe "Personen". Ich halte den Klammerzusatz "Person" für vertretbar. Auch der OGND-Katalog zeigt "Bencivenni Medici <Familie>" als "Person, individualisert (GND)" an. (Ohne Klammerzusatz sollte stets heißen: Bitte Parameter "Typ" nachtragen.) --Kolja21 (Diskussion) 15:37, 9. Mai 2012 (CEST)
  4. Vorlage:PNDfehlt integrieren als TYP=n.
    1. Pro --Kolja21 (Diskussion) 01:33, 9. Mai 2012 (CEST)
    2. der Parameter "TYP" sollte sich glaube ich nicht nur auf die GND beziehen sondern allgemein mitteilen um welchen Typ es sich handelt. Wenn es eine Person ist, sollte TYP=p möglich sein, auch wenn keine GND vorhanden ist. Die Integration von PNDfehlt kann natürlich trotzdem gemacht werden (aber anders). --APPER\☺☹ 10:18, 9. Mai 2012 (CEST)
    3. Du hast völlig recht. Den Fall "nicht individualierte GND" trifft auf individualierte Normdaten anderen Ursprungs hatte ich nicht bedacht (s. Disk. unter "Internationalisierung"). Wir müssen die Vorlage:PNDfehlt auf einem anderen Weg integrieren. --Kolja21 (Diskussion) 16:39, 9. Mai 2012 (CEST)
    4. Es gibt also m. E. zwei Möglichkeiten: entweder wie schon mal irgendwo hier geschrieben die GND mit einem Paramter direkt verbinden, also "GND=129873123/n" -> elegant, aber wahrscheinlich hochaufwendig bei der Auswertung, oder "GND=129873123" und ein weiterer Parameter "GND-NurName=1" oder "GND-nichtindividualisiert=1" oder ähnlich. Andere Vorschläge? --AndreasPraefcke (Diskussion) 08:46, 10. Mai 2012 (CEST)
      Das ist genau der Fall wo wir auch und im Zusammenhang damit Datum und Bemerkung benötigen. Was wäre, wenn wir etwas analoges wie PNDfehlt als Vorlage integrieren (geschachtelte Vorlagen also auf den "Wartungsfall" einschränken):
      etwa als
      • (Tn) {{Normdaten | TYP=p | LCCN=n/00/1234 |...| REMARK={{GNDProblem|2012-05-10|GND=129873123}}. PND/F eingetragen, VIAF uneindeutig}}
      • (fehlt) {{Normdaten | TYP=p | LCCN=n/00/1234 |...| REMARK={{GNDProblem|2012-05-10}}. VIAF uneindeutig}}
      oder etwas flacher als
      • (Tn) {{Normdaten | TYP=p | LCCN=n/00/1234 |...| GNDWartung=129873123 [2012-05-12] | REMARK=PND/F eingetragen, VIAF uneindeutig}} bzw.
      • (fehlt) {{Normdaten | TYP=p | LCCN=n/00/1234 |...| GNDWartung=[2012-05-12] | REMARK=VIAF uneindeutig}}
      "flach" bedeutet aber m.E. immer, dass in einem Parameter manchmal ein Doppelinhalt aus Nummer und zumindest Datum steht (und manchmal nicht), der da von jeglichem Mechanismus erst einmal wieder irgendwie herausinterpretiert werden muss.
      "Mit Vorlage" könnte hingegen zwei Nebenziele erreichen:
      1. Für gewisse Auswertungen könnte der GND-Parameter der Untervorlage genauso gut wie ein echter GND-Parameter sein
      2. Es gab auf Wikipedia Diskussion:PND/Fehlermeldung#PNDF-Template bereits einmal einen Anlauf, besonders schematische Meldungen (dort) per Template zu gestalten. Wenn nun aber im Artikel die Wartungs-Subvorlage auch noch einen Parameter zur "Problemklasse" bekommt, könnte im Prinzip automatisch gemeldet werden?
      Mir ist klar, dass mit dem "subst"-Mechanismus auch die Vorteile beider Ansätze verbunden werden können. Wenn wir die "flache" Lösung irgendwie logisch und sauber hinbekommen, wäre ich sofort dafür. -- Thomas Berger (Diskussion) 09:29, 10. Mai 2012 (CEST)
      1. Dann doch lieber gleich {{Normdaten|Typ=p|GND=|LCCN=n/00/000|VIAF=|GNDName=1374638347|DATUM=2012-05-02|REMARK=PND/F eingetragen, VIAF uneindeutig}} Dann hätte jeder beim Auslesen der gesamten Vorlage alle nötigen Daten. "GNDName vorhanden" triggert gleichzeitig eine unsichtbare Wartungskategorie, die dann auch per CatScan auslesbar wäre. Manuell zu leistendes, Nachrichten an die DNB etc. können in die Anmerkung. Für den Fall, dass leerer GND-p-Satz und voller GND-n-Satz mit Werken der Person vorhanden sind, könnte man GND und GNDName ausfüllen, GNDName kann dann weg, sobald die Werke beim Tp gelandet sind. In das REMARK-Feld könnten zusätzliche GND-n-Sätze eingetragen werden oder kurze Hinweise a la "die heimatkundlichen Werke, nicht jedoch die medizinischen" o. ä., oder sogar "Todesdatum fehlt" oder ähnliche Hinweise an die GND-Redaktion. Das alles ließe sich automatisch auslesen und würde diese lähmenden PND/F-Meldungen reduzieren auf wirkliche Problemfälle, z. B. doppelte p-Sätze (die ja hoffentlich bald ohne unser Zutun erheblich weniger werden) und falsche Zuordnungen. DATUM wäre in allen Fällen die letzte Änderung der Werte in der Vorlage, unabhängig davon, was drin steht, bzw. auch das Datum der letzten erfolglosen Suche nach neuen Werten. --AndreasPraefcke (Diskussion) 11:56, 10. Mai 2012 (CEST)
        Und bei überaupt nicht in der GND nachgewiesenen Personen (da gibt es dann auch wenig zu kommentieren?) {{Normdaten|Typ=p|GND=|LCCN=n/00/000|VIAF=|DATUM=2012-05-02}}, d.h. die Aussage, dass ein GND-Satz nicht ermittelbar war, ist einzig an die Existenz von "DATUM" gekoppelt: Das geht gewiss schief! Also müssten wir zusätzlich zu DATUM vorschreiben, dass REMARK mit einem stereotypen Text auszufüllen ist... -- Thomas Berger (Diskussion) 12:44, 10. Mai 2012 (CEST)
        Ob das wirklich schief geht? Die Normdatenspezialisten werden mittels Skript immer auch GND absuchen. Die anderen Wikipedianer tragen aus Gewohnheit irgendwie die PND (bzw. jetzt natürlich GND) ein, aber kümmern sich um so etwas wie VIAF und LCCN doch eh nicht. Gibt es bei uns ernsthaft sehr viele Sätze, die VIAF enthalten, nicht aber PND, und wo eine individualisierte PND vorhanden wäre? Ich kann mir das nicht vorstellen. DATUM sagt dann halt aus, dass jemand nach Normdaten allgemein schon gesucht hat, das erlaubt, diese Artikel erst wieder nach, sagen wir, einem Jahr, erneut manuell anzuschauen. Sobald die PND offen und frei vorliegen, sollten doch eh Skripte möglich sein, die alle Normdaten-Vorlagen anschauen, schauen wo LCCN drin ist, nicht aber GND oder GNDName, dann schauen ob von LCCN velinkten VIAF-Satz GND drin steht und das dann irgendwie ausgeben und zum halbautomatisierten Befüllen. --AndreasPraefcke (Diskussion) 12:56, 10. Mai 2012 (CEST)
        Ich hatte eben überlesen, dass DATUM sich auf die ganze Vorlage beziehen soll. Dann würden automatisierte Fehlermeldungen aber ständig neu generiert werden bzw. ihr Datum ändern und das klassische "fehlt komplett" könnte gar nicht mehr abgebildet werden, denn ein ergänzter NDL-Parameter sagt nichts darüber aus, wie ernsthaft sich der Bearbeiter um Ergänzung anderer Parmeter bemüht hat. Daher brauchen wir noch einen Parameter "GNDREDAKTION=2012-05-10 fehlt" (führt nicht zur Meldung), "GNDREDAKTION=2012-05-10 Tn" (GNDName kann invididualisiert werden bzw. je nachdem ob auch der GND-Parameter belegt ist wird eine - partielle? - Zusammenführung angemahnt), oder "GNDREDAKTION=2012-05-10 Tp 1234" (mehrere Tp sollten zusammengeführt werden) etc. Jeder dieser Meldungstypen setzt dabei ein bestimmtes Kürzel voraus und beruht auf einer gewissen Konstellation der anderen Parameter GND und/oder GNDName, ansonsten entstehen völlig wirre Meldungen. Ob das praktikabel sein wird? Vielleicht sollten wir das automatisierte Problem-Melden doch erst einmal beiseite lassen, aber andererseits brauchen wir das Datum ohnehin nur um nicht zu oft die maschinell feststellbaren Lücken in der Vorlagenbelegung nachzuprüfen. Wie wäre es mit einem spezialisiertem GNDDATUM statt dem allgemeinen, sich auf die ganze Vorlage beziehenden DATUM? -- Thomas Berger (Diskussion) 13:15, 10. Mai 2012 (CEST)
        OK, die Fehlermeldungen zu automatisieren, ist zu komplex und muss nicht im Artikel geschehen. Also: die Funktionalität von PNDfehlt einzubauen (das wollen wir ja weiterhin), wäre dann: "GNDName=19834298347|GND-Datum=2012-05-09", und ein REMARK-Feld kann ja ohnehin nie schaden. --13:36, 10. Mai 2012 (CEST)
        GNDName (optional, falls GND mit Grund nicht belegt wird oder werden kann, aber ein ~in gewisser Weise zutreffender~ Tn-Satz vorhanden ist - den Ermessensspielraum haben wir auch mit der PNDfehlt-Vorlage ausgehalten) und evtl. besser GNDCheck für das Datum (wir wollen bekräftigen, dass hier geprüft wurde und nicht riskieren, dass jemand den Redaktionsstand des GND-Satzes einträgt)? -- Thomas Berger (Diskussion) 17:21, 10. Mai 2012 (CEST)
      2. Wichtig wäre, beim großen Botlauf nicht nur PNDfehlt auszulesen und als GNDName einzutragen, sondern auch die Vorlage DNB-Portal und in den Fällen, wo DNB-Portal <> Normdaten-Vorlage-PND ist und keine PNDfehlt-Vorlage vorhanden ist, die DNB-Portal-Vorlagen-PND bei GNDName einzutragen. --AndreasPraefcke (Diskussion) 12:02, 10. Mai 2012 (CEST)
      3. Kleine Anm.: Bitte nicht den Parameter "GNDProblem" nennen, denn "Problem" kann alles mögliche bedeuten. Da die Bezeichnung "PNDfehlt" bekannt ist, wäre "GNDfehlt" am einfachsten zu verstehen. Geschweifte Klammern (innerhalb der geschweiften Klammern) zu vermeiden, würde ebenfalls die Lesefreundlichkeit enorm erhöhen (und entsprechend Tippfehler vermeiden helfen), aber falls es für die Auswertung wichtig ist, muss es eben sein. --Kolja21 (Diskussion) 17:44, 10. Mai 2012 (CEST)
  5. Umgang mit den Dubletten klären. (Zweite GND eintragen oder sich für eine GND entscheiden?)
    1. Bei PNDs wurden Dubletten ja gemeldet, bisher habe ich dann im Artikel nichts gemacht und die korrekte dann eingetragen nachdem die Rückmeldung der DNB kam. Vielleicht kann Raymond ja klären, ob wir über WP:PND/F auch doppelte ehemalige GKD/SWD melden können. --APPER\☺☹ 10:18, 9. Mai 2012 (CEST)
    2. Ich dachte an die Dubletten SWD und GKD, die es noch eine Weile geben wird, je nachdem wie gut das automatische Mergen gelingt. Aber ich denke auch, wir sollte uns für eine GND entscheiden. (In der Regel die, die mehr Informationswert besitzt.) Schlimmstenfalls ist der Link dann für ein paar Monate nicht so ergiebig, wie mit Dublette, aber das lohnt nicht den doppelten Aufwand. Außerdem müssen wir nicht gleich morgen die Vorlagen SWD und GKD löschen, haben also Zeit. --Kolja21 (Diskussion) 15:45, 9. Mai 2012 (CEST)
    3. ...
  6. Der PICA-Link in der Vorlage ist seit langem veraltet.
    1. Als Alternative bietet sich der OGND-Katalog an. (Der vom BSZ betriebene Katalog bietet den Vorteil, dass auch die alten Norm-Nrn. angezeigt werden. Beispiel: "Ernst Schnabel".) Von mir aus können wir den PICA-Link aber auch ganz weglassen. --Kolja21 (Diskussion) 01:33, 9. Mai 2012 (CEST)
    2. Der PICA-Link wird ja sowieso nur Personen abgezeigt, die die Personendaten-Anzeige aktiviert haben. Entscheidend ist, dass ich bisher keine andere Anzeige der Rohdaten kenne... und z.B. tagesgenaue Lebensdaten bisher ausschließlich darüber sichtbar sind... --APPER\☺☹ 10:18, 9. Mai 2012 (CEST)
      Auch in der OGND ist die Umschaltung auf die Sicht im PICA-Format möglich -- Thomas Berger (Diskussion) 15:03, 9. Mai 2012 (CEST)
      1. Stimmt, aber auf einen der beiden PICA-Sätze würd ich gerne weiterhin 'nen Link haben. Alternativ kann ich mir das aber natürlich auch selbst per javascript basteln ;) --APPER\☺☹ 16:01, 10. Mai 2012 (CEST)
        Ah ja, direkte Verlinkung. Die klappt (mittels "PPN") bei der DNB, weil die GND-Nummer gleichzeitig die interne Nummer aus Feld 003@ ist und das ist genau die Stelle, wo die Internanzeige der OGND sich unterscheidet (in der SWB-Datenbank ist es halt eine andere interne Nummer). Aber da http://dispatch.opac.d-nb.de/ offensichtlich die GND-Version des Datensatzes zeigt, also etwas recht aktuelles, sehe ich auch keinen Handlungsbedarf, die "PICA"-Links umzustricken. An 1015699286 sieht man, dass die Lebensdaten (dieser Datensatz hat spassigerweise nur "exakte", keine "normierten") auch in der OGND nicht gezeigt werden, und leider auch nicht in der RDF-Darstellung im DNB-Portal. Aber ab Juli dürfte man ja auch eine Live-Abfrage auf dem Toolserver implementieren... -- Thomas Berger (Diskussion) 17:14, 10. Mai 2012 (CEST)
  7. Parameter "DATUM", "DATE" oder "TIMESTAMP": Das Datum der letzten Änderung bzw. Prüfung angeben.
    1. "Daraus können dann Wartungskategorien abgeleitet werden", Thomas Berger, 6. Mai.
    2. Welche Form? 2012-05-09 (wäre einfacher internationalisierbar) oder 9. Mai 2012 wie gehabt? --AndreasPraefcke (Diskussion) 09:01, 9. Mai 2012 (CEST)
    3. Ich denke in der Form 2012-05-09, nicht nur wegen der Internationalisierbarkeit sondern auch wegen eventueller Wartungskategorien. Bin mir nicht sicher, aber ich denke, eine Wartungskategorie der Art "Zuletzt geprüft 2009" wäre so möglich. --APPER\☺☹ 10:18, 9. Mai 2012 (CEST)
    4. Kann ich den Parameter "TIMESTAMP", der im Dump 37x auftaucht, in der Form 2012-05-09 in Vorlage:Normdaten/Doku bereits aufnehmen? (Die Vorlage muss dafür ja nicht geändert werden, oder?) Dann hätten wir schon mal einen Punkt abgehakt. --Kolja21 (Diskussion) 20:03, 10. Mai 2012 (CEST)
    5. Für mich klingt Timestamp so, als ob da zwingend eine Uhrzeit dabei sein müsste ... -- Monsieur Becker (Diskussion) 20:16, 10. Mai 2012 (CEST)
    6. Hm, auch wieder wahr. Was haltet ihr von "DATE"? Das ist international und kürzer. --Kolja21 (Diskussion) 20:31, 10. Mai 2012 (CEST)
    7. So recht erschließt sich mir der Sinn nicht. Wann soll der Parameter angegeben werden? Wozu soll er genutzt werden? --APPER\☺☹ 21:14, 10. Mai 2012 (CEST)
    8. In einer anderen Faser oben hatte ich "GNDCheck" vorgeschlagen: Benötigt wird das Datum, an dem das letzte Mal verifiziert wurde, dass es noch Verbesserungsbedarf speziell bezüglich des GND-Parameters gibt. -- Thomas Berger (Diskussion) 22:46, 10. Mai 2012 (CEST)
    9. @APPER: Hattest du nicht selbst geschrieben: "... auch wegen eventueller Wartungskategorien"? Bei der PNDfehlt-Vorlage hat sich die Angabe als nützlich erwiesen. Für mich stellt sich daher nicht die Frage Datum ja oder nein, sondern Datum für die letzte Überarbeitung bzw. Überprüfung der Normdaten oder nur in Zusammenhang mit dem GNDfehlt-Parameter. --Kolja21 (Diskussion) 00:50, 11. Mai 2012 (CEST)

Weitere Punkte

  1. Web NDL Authorities statt SELIBR: Bei der Überarbeitung der Vorlage sollten wir die selten genutzte und bereits durch die VIAF erfasst SELIBR durch eine andere Normdatei ersetzen, die die Vorlage internationaler macht. Ich könnte mir als Ersatz beispielsweise die "Web NDL Authorities" der Nationalen Parlamentsbibliothek (NDL) Japans vorstellt (s. ja:Template:Normdaten). --Kolja21 (Diskussion) 06:39, 8. Mai 2012 (CEST)
    1. Ja, SELIBR ist wirklich ein historischer "Ballast", der zudem immer völlig unplausibel macht, warum wir BNF oder SUDOC nicht eingebaut haben. Oder verwendet irgendjemand SELIBR in der Wikipedia sinnvoll? Die mir ansonsten sinnvoll erscheinenden ULAN oder SUDOC sind ja inzwischen auch in der VIAF erfasst (allerdings gerade ULAN oft genug als einzelne, nicht zusammengefasste Datensätze, vor allem wohl da ULAN ja keine Werke enthält und das automatische Zusammenfassen daher dort auf Namen/Lebensdaten beruht, die bei Künstlern gerne sehr verschieden angesetzt bzw. geschätzt werden) --AndreasPraefcke (Diskussion) 11:19, 8. Mai 2012 (CEST)
    2. Kann jemand aus dem Dump der jap. Wikipedia eine Liste der Artikel erstellen, die bereits die Normdatenvorlage mit dem Parameter "NDL" verwenden? --Kolja21 (Diskussion) 01:48, 9. Mai 2012 (CEST)
      Da NDL ja VIAF-Teilnehmer ist, geht es evtl. besser mit dem hier beschriebenen Feature: [5] -- Thomas Berger (Diskussion) 08:44, 9. Mai 2012 (CEST)
      Nicht ganz das gewünschte, aber hier sind alle japanischen Links auf die NDL Authorities. --Mps (Diskussion) 18:12, 9. Mai 2012 (CEST)
      52 Transklusionen im ANR also. Ts. Ts. Ich mach die Auswertung aber trotzdem mal. -- Thomas Berger (Diskussion) 18:39, 9. Mai 2012 (CEST)
      Davon haben allerdings nur eine geringe Zahl deutsche Artikel:
      石原慎太郎 -> Shintarō Ishihara: http://id.ndl.go.jp/auth/ndlna/00020782
      三島由紀夫 -> Mishima Yukio: http://id.ndl.go.jp/auth/ndlna/00043882
      南部陽一郎 -> Yōichirō Nambu: http://id.ndl.go.jp/auth/ndlna/00053831
      鈴木光司 -> Kōji Suzuki: http://id.ndl.go.jp/auth/ndlna/00204683
      是枝裕和 -> Hirokazu Koreeda: http://id.ndl.go.jp/auth/ndlna/00258573
      アンブローズ・ビアス -> Ambrose Bierce: http://id.ndl.go.jp/auth/ndlna/00433285
      オー・ヘンリー -> O. Henry: http://id.ndl.go.jp/auth/ndlna/00443080
      ヒュー・ロフティング -> Hugh Lofting: http://id.ndl.go.jp/auth/ndlna/00447952
      東浩紀 -> Hiroki Azuma: http://id.ndl.go.jp/auth/ndlna/00695923
      平野啓一郎 -> Keiichirō Hirano: http://id.ndl.go.jp/auth/ndlna/00709718
      --Mps (Diskussion) 18:53, 9. Mai 2012 (CEST)
    3. Bin sehr für die Entfernung von SELIBR. --APPER\☺☹ 10:22, 9. Mai 2012 (CEST)
    4. @Thomas: Hast du eventuell VIAF mit WorldCat verwechselt? Auf viaf.org finde ich Japan nicht. --Kolja21 (Diskussion) 15:50, 9. Mai 2012 (CEST)
      Du hast recht. Im von mir zitierten Blog-Post von gestern kommt "NDL" vor, der reale Datensatz [6] enthält die Nummer nicht. Da scheint irgendein Testsystem mehr zu kennen als das Produktionssystem. Das heisst aber, dass NDL-Daten recht bald in VIAF auftauchen könnten? -- Thomas Berger (Diskussion) 16:32, 9. Mai 2012 (CEST)
      Es kann sein, dass einzelne Kataloge die NDL in ihren Metadaten verlinken. Mit der VIAF ist vorerst keine Zusammenarbeit geplant, sonst wäre die NDL unten "Testläufe" (zzt. Russland und Norwegen) vermerkt. (Auf die NDL bin ich, wie gesagt, gekommen, da sie in jp:Template:Normdaten bereits verlinkt wird.) --Kolja21 (Diskussion) 16:47, 9. Mai 2012 (CEST)
      Wie gesagt, ein Post von gestern im offizösen VIAF-Blog zeigte eine NDL-Datum. Das war gewiss ein Copy&Paste-Versehen aus einem Testsystem (die von Dir angesprochenen Testdaten sind ja im offiziellen System bereits sichtbar), aber definitiv VIAF. Ansonsten: Den ja-Dump habe ich schon gezogen, warte aber noch auf das Download-Ende des aktuellsten de-Dumps, dann erstelle ich die Konkordanz. -- Thomas Berger (Diskussion) 18:06, 9. Mai 2012 (CEST)
  2. Was soll mit dem Parameter WORLDCATID passieren?
    1. Der Link zu WorldCat wird in der Regel automatisch generiert. Auf Wunsche eines Einzelnen hat Selbiger ihn letzten August in die Vorlage eingefügt.[7] Genutzt wird er bislang kaum (Dump: 24 Treffer), und die Ergebnisse entsprechen auch nicht immer den Anforderung, die man Normdaten stellt; oft finden sich in dem Metakatalog mehrere Personen in einem Datensatz zusammengewürfelt, die in den zugrunde liegenden Katalogen getrennt sind. --Kolja21 (Diskussion) 01:25, 11. Mai 2012 (CEST)
    2. ...
  3. Abgleichung mit der Vorlage:DNB-Portal. Auch dort gibt es den Parameter "TYP". Man sollte die Parameter einheitlich benennen. "TYP=p" ergibt in der Vorlage:DNB-Portal dann beispielsweise standardmäßig "Literatur von und über", "TYP=g" dagegen "Literatur über", da ein Ort kein Autor ist, der selbst Werke verfasst. (Der alte Parameter "TYP" in der Vorlage:DNB-Portal sollte entsprechend umbenannt werden, z.B. in "TEXT".)
    1. Klingt gut. --APPER\☺☹ 10:22, 9. Mai 2012 (CEST)
    2. Klingt gut, vor allem wenn man das gleich in einem Botlauf miterledigen kann. Wenn wir schon 180.000 Edits generieren, ist das sehr vernünftig. --AndreasPraefcke (Diskussion) 10:29, 9. Mai 2012 (CEST)
  4. Andere, auf der GND beruhende Vorlagen anpassen oder löschen. Unter Hilfe:GND#Vorlagen gibt es eine Übersicht über die Vorlagen, die die GND bzw. dessen Vorgänger verwenden.
    1. Ich kümmere mich zzt. um die Abarbeitung der, schon vor der Einführung der GND, veralteten Vorlage:DM. --Kolja21 (Diskussion) 00:53, 9. Mai 2012 (CEST)
    2. Ich bin schon länger immer mal wieder an der Vorlage:PND dran, aber sie hat immer noch 3.500 Einbindungen. Automatisch geht da gar nichts, zu vielfältig sind die Aufgaben in diesen Artikeln. --AndreasPraefcke (Diskussion) 10:01, 9. Mai 2012 (CEST)
    3. Halte durch ;) Gibt es eine geeingete Stelle in Wikipedia, um einen Aufruf zur Mitarbeit zu starten? Die Wartungslisten von APPER haben ja teilweise ganze Heerscharen von freiwilligen Helfern mobilisiert. --Kolja21 (Diskussion) 15:56, 9. Mai 2012 (CEST)
    4. Das wäre sicher möglich, aber ich traue es außer dem hier versammelten illustren Kreis eigentlich niemandem zu, das in vertretbarer Zeit und ohne allzugrobe Fehler zu schaffen. Ich hab z. B. schon fast alle Frauen mit PND-Vorlage und ohne Normdaten-Vorlage durch, es bleiben noch 1800 Männer. Bei den meisten ist es eine nichtindividualisierte PND, die da eingetragen wurde. Bis man das wieder alles Neulingen erklärt hat, hat man's zehnmal selbst gemacht. Und dann können die Neulinge es, und wir verändern sofort danach das gesamte System... ;-) --AndreasPraefcke (Diskussion) 16:45, 9. Mai 2012 (CEST)
  5. Internationalisierung: Zum Abschluss sollten wir die Normdatenvorlagen der anderssprachigen Wikipedias (unter Berücksichtigung der dortigen Wünsche und Vorlieben) anpassen oder zumindest auf den Diskussionsseiten die Änderungen, die wir an de:Vorlage:Normdaten vorgenommen haben, dokumentieren.
    1. Da TYP arg allgemein ist, sollten wir vielleicht im Sinne der Nachhaltigkeit und Internationalisierung GND-TYP o. ä. nehmen, damit klar ist, dass sich das nur auf die GND bezieht? Oder vielleicht lieber "Typ" statt "TYP" schreiben, damit klar wird, dass das keine weitere Normdatei ist (analog den Großbuchstabenakronymen GND, LCCN, VIAF), sondern etwas ganz anderes? --AndreasPraefcke (Diskussion) 09:00, 9. Mai 2012 (CEST)
    2. Wie erwähnt würde ich den "TYP" (oder "Typ") nicht nur auf die GND beziehen sondern allgemein damit kennzeichnen, dass es sich um einen "Personenartikel" handelt (bei TYP=p). Wir bedienen uns da zwar bei der DNB, aber nutzen es eher allgemein. Ansonsten könnte man auch "GND=123456/p" und "GND=654321/g" machen oder so... --APPER\☺☹ 10:22, 9. Mai 2012 (CEST)
      1. Ah, dann hatte ich das nicht richtig verstanden. Mir wird etwas schwindelig bei der Vorstellung, dass die Leute dann überall p für Personen eintragen und die GND gerade eben doch wieder nur "n" (Name) ist. Für eine Artikelkennzeichnung haben wir unsere Hauptkategorien (Mann/Frau z. B.), das muss man doch eigentlich nicht dopplen, oder? Außerdem wie gesagt: im Typ "Person" sind auch Familien versteckt. TYP=g und TYP=p und TYP=w haben die Eleganz, auch auf Englisch als geographic und person und work zu funktionieren, s notfalls als "subject term", v für Veranstaltung wird allerdings international problematischer sein. --AndreasPraefcke (Diskussion) 10:47, 9. Mai 2012 (CEST)
        Traditionell nennt MARC das "Meeting" (meint damit aber nicht nur Kongresse, sondern auch Ausstellungen und Sportveranstaltungen) Es gibt da aber keinen allgemein etablierten Code, weil der Typ implizit über einander ausschliessende Datenfelder für die "Hauptansetzung" geregelt ist (die Codes der GND sind an der "9" im Feld 079 unschwer als "privat" zu erkennen, gemeint ist die "nationale Anwendungsschicht").
      2. Wie wir es verstehen wollen, ist ziemlich wichtig: TYP=n wäre je nach Sicht z.B. gar nicht möglich.
        1. Typ ist der Typ der GND: Dann können wir strenggenommen Personen oder Körperschaften gar nicht kennzeichnen, wenn sie etwa in VIAF vorkommen, aber nicht in der GND. Dafür können wir recht deutlich Tp gegen Tn abgrenzen.
        2. Typ ist ein universeller Typ des Gegenstands des WP-Artikels: Dann kann man ihn sich günstigstenfalls vom GND-Satz abgucken, es muss aber auch selbstformulierte und einfache WP-Regeln dazu geben, damit ein Bearbeiter ihn notfalls ohne vorhandenen GND-Satz eintragen kann (weil ausser bei Personen die Weltsicht des Vorlagen- und Kategoriensystems nicht simplistisch genug ist für eine solch grobe Schmatisierung, sehe ich da wenig Redundanz oder Konfliktpotential). -- Thomas Berger (Diskussion) 16:03, 9. Mai 2012 (CEST)
    3. Ich plädiere für "universeller Typ"; eine Unterscheidung zwischen Typ-Allgemein und Typ-GND würde die Vorlage nur noch für Experten nutzbar machen. Aber das Problem mit dem Sonderfall "Typ=n" leuchtet mir ein. Dann müssen wir die Vorlage:PNDfehlt anders einbauen. --Kolja21 (Diskussion) 16:32, 9. Mai 2012 (CEST)
  6. Sichtbarkeit von Informationen in der ganz normalen Wikipedia-Ansicht für Endnutzer. Es gibt da ja zur Zeit Streit (mit einem einzigen Benutzer allerdings nur). Was soll alles angezeigt werden, und in welcher Form, und was soll verlinkt werden? --AndreasPraefcke (Diskussion) 11:36, 9. Mai 2012 (CEST)
    1. Pro Wenn die Vorlage so wie hier besprochen ausgebaut ist, sollte sie standardmäßig für alle sichtbar sein. --Kolja21 (Diskussion) 16:11, 9. Mai 2012 (CEST)

Ausblick

  1. SeeAlso-Funktionalität direkt in Wikiepdia anbieten. Es ist einfach eine Schande, dass eine so elegante und einfache Sache wie http://beacon.findbuch.de/seealso/pnd-aks?format=sources&id=118520539 nicht einmal per Gadget direkt in der Wikipedia verfügbar ist. Falls dafür irgendetwas an der Normdatenvorlage gemacht werden muss, könnte man das jetzt gleich miterledigen. --AndreasPraefcke (Diskussion) 09:10, 9. Mai 2012 (CEST)
  2. Sollte das APPER-Tool alle personenbezogenen GND auslesen, also auch reine Namenssätze (und entsprechend gekennzeichnet anzeigen natürlich)? Ich wäre dafür, es gibt inzwischen genug BEACON-Dateien, die auch solche verzeichnen. --AndreasPraefcke (Diskussion) 11:33, 9. Mai 2012 (CEST)
  3. Soll die Wikipedia mehrere BEACON-Dateien bereitstellen, eine nur mit den Typ=p-Nummern, eine mit allen (und vielleicht eine nur mit Typ=n)? --AndreasPraefcke (Diskussion) 11:33, 9. Mai 2012 (CEST)
    ad 1-3: APPER hat ja auf Anfrage inzwischen für diverse Nummernsysteme (LCCN, VIAF, ... auch IMdb und andere?) Resolver eingerichtet, im Prinzip kann man sich für jeden dieser Resolver eine BEACON-Datei denken, die vorab ankündigt, was der Resolver derzeit auflösen kann (vielleicht kann man den Typ dann irgendwo hineincodieren, so dass Nutzer dieser Ausspielungen sie bei Bedarf weiter herunterfilter können). Betrachtet man zusätzlich die Interwiki-Links, so könnte zu einer GND-Nummer die Liste aller Sprachen und Lemmas gezeigt werden, für die jeweils ein Artikel geliefert werden kann: Das ist dann mehr als ein einfacher Resolver und ginge in Richtung OpenSearchSuggestions oder SeeAlso. Umgekehrt könnten Bots über die InterwikiLinks die Äquivalente der Normdatenvorlage in Nachbarprojekten im Auge behalten und gewisse Parameter hier automatisiert auzufüllen, vgl. die NDL-Gedanken oben oder einige Überlegungen auf commons -- Thomas Berger (Diskussion) 15:44, 9. Mai 2012 (CEST)
  4. Das Helferlein normdaten.js von Benutzer:Schnark muss angepasst werden. Ich habe ihn angeschrieben und auf diese Diskussion schon mal verwiesen. --AndreasPraefcke (Diskussion) 11:53, 9. Mai 2012 (CEST)
  5. Fehlen eigentlich wichtige Normdatenangebote, die über VIAF nicht verfügbar sind und auch nicht bald dort auftauchen werden? Gibt es eigentlich irgendetwas, was die Naturwissenschaftler/Mediziner brauchen könnten? In diesem Bereich scheinen mir die bisherigen Bibliotheksdateien allgemein doch sehr dürftig zu sein. Irgendetwas für Aufsatzdatenbanken oder ein Citation Index oder so etwas? --AndreasPraefcke (Diskussion) 19:57, 9. Mai 2012 (CEST)
    ORCID und en:ISNI gibt es m.W. noch nicht wirklich. Darüber hinaus werden die bibliothekarischen Normdateien nie alles zu Musik und Film abdecken können, aber die Vorlage:IMDb_Name ist derzeit ein guter Normdaten-Ersatz (ich glaube es gab noch nie Einwände die bei den Weblinks einzutragen). Bliebe höchstens noch die Vorlage:MusicBrainz_Künstler, die hier traditionell nicht unbedingt für Personen im Bereich der Klassik genutzt wird. -- Thomas Berger (Diskussion) 20:11, 9. Mai 2012 (CEST)
    Eine IPI-Nummer ist eingetragen (Ne Rheinische Jeck). -- Thomas Berger (Diskussion) 18:21, 10. Mai 2012 (CEST)
    Das sieht zwar grundsätzlich interessant aus, aber da begeben wir uns vielleicht ein bisschen zu sehr in Richtung Rechtsberatung... --AndreasPraefcke (Diskussion) 18:40, 10. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Auswertungen des aktuellen Dumps

ja:WP bzgl. NDL

Der Dump 20120503 enthält etwa 1170 Einbindungen des Normdaten-Templates (evtl. nicht alle ANR, manche auskommentiert, 966 haben einen Interwiki-Link nach de:WP), 40 der Normdaten-Templates tragen den NDL-Parameter, davon wiederum mit Interwiki zu de:WP die folgenden: -- Thomas Berger (Diskussion) 10:29, 10. Mai 2012 (CEST)

  1. Hirokazu Koreeda -- NDL:00258573
  2. Arthur Conan Doyle -- NDL:00438206
  3. Mishima Yukio -- NDL:00043882
  4. O. Henry -- NDL:00443080
  5. Hiroki Azuma -- NDL:00695923
  6. Hugh Lofting -- NDL:00447952
  7. Ambrose Bierce -- NDL:00433285
  8. Yōichirō Nambu -- NDL:00053831
  9. Keiichirō Hirano -- NDL:00709718

Sowie:

  1. Shintarō Ishihara -- NDL:00020782
  2. Kōji Suzuki -- NDL:00204683

--Mps (Diskussion) 10:34, 10. Mai 2012 (CEST)

Sollen wir dann schon mal, unabhängig von der großen Überarbeitung, den Parameter SELIBR gegen die NDL (Japan) austauschen? Ich wäre dafür, denn die SELIBR wird selbst von der schwedischen Wikipedia nicht genutzt. --Kolja21 (Diskussion) 10:51, 10. Mai 2012 (CEST)
PND und LCCN sind wichtige Normdaten hier, weil es 1. sehr grosse Normdateien sind, 2. Verlinkungsmöglichkeiten auf Normdatenanzeigen (plus evtl. mehr) existieren, 3. diese Normdatenanzeigen u.U. biographische Zusatzinformation enthalten, die die VIAF-Sicht dieser Sätze nicht hat (und darüber hinaus haben wir 4. einen Redaktionskanal zur GND). Punkt 3 halte ich für ziemlich wertvoll, hier punkten v.a. LoC-NA, NUKAT und SUDOC, es gibt aber auch eine interessante neue Sicht auf BNF-Daten unter data.bnf.fr. ::Andererseits ist es so, dass je "besser" oder "attraktiver" die Daten sind, desto größer ist die Chance, sie fehlerlos über VIAF oder Interwiki-Links von anderswo automatisiert abzugreifen. Insofern wird dann hier vor allem attraktiv, was möglichst komplementär zu den bislang beschickten Parametern ist (etwa weil eine VIAF-Teilnahme dieser Normdatei nicht absehbar ist) und es kein geeignetes Schwesterprojekt gibt, das diese Daten ohnehin erfasst (fr:WP und it:WP z.B. scheinen keine grosse Affinität zu Vorlagennutzung allgemein und Datenbanklinks im besonderen zu haben).
Klar ist eigentlich nur, dass speziell SELIBR, für das nur eine VIAF-Anzeige existiert, sehr wenig Sinn macht: eine kleine Normdatei, wenig komplementär, keine Zusatzinformation und kein attraktiver Zusatznutzen durch Verlinkung (und nur die Tatsache, dass es die schwedische Wikipedia nicht nutzt wäre Anlass zu Überlegungen, in der deutschsprachigen WP auszuhelfen ;-). BNF und SUDOC werden immer attraktiver, von fr:WP scheint dahingehend nichts zu erwarten, sind aber über VIAF gut vernetzt. Bei NDL (für gewisse Personengruppen gewiss hochgradig komplementär) hingegen könnte es sein, dass die Normdatenarbeit in ja:WP einen guten Start hat und wir uns auf das Nachvollziehen per Interwiki-Link zurückziehen könnten. Aufgrund der offensichtlichen Sprachprobleme ist jedenfalls nicht zu erwarten, dass dieser Parameter hier besonders konsequent ausgefüllt werden wird. -- Thomas Berger (Diskussion) 12:20, 10. Mai 2012 (CEST)

Und wie sieht es mit Russland aus? Gibt es da etwas? Wior haben sehr viele Biografien (auch Ex-UdSSRler anderer Nationen) bei uns, und es gibt wohl auch sehr große Probleme der automatisierten Angleichung à la VIAF (das merkt man, wenn man mal mit einer beliebigen Transliteration oder Transkription einen Namen dort sucht, oft braucht es viele Versuche, etwas zu finden, manchmal helfen nur noch die Lebensdaten ohne alles...) --AndreasPraefcke (Diskussion)

Für die Aufnahme der BnF wäre ich sofort, aber data.bnf.fr erfasst nur einen kleinen Teil der französischen Normdaten und der Link funktioniert nur, wenn neben der Nr. zusätzlich der Name angegeben wird:
data.bnf.fr/11901063/alexandre_dumas/ -- klappt
data.bnf.fr/11901063/ -- "404 Document non trouvé"
Dann nimm' halt data.bnf.fr/11901063
Ich hatte gedacht, dass sie vom ark-Identifier-System auf etwas Web-freundlicheres umstellen, aber das war vielleicht Wunschdenken. Weisst Du etwas darüber, welcher Teil der Normdaten auf die neue Art zugänglich ist (und warum nicht alle)? -- Thomas Berger (Diskussion) 20:06, 10. Mai 2012 (CEST)
Russland hat zwei Nationalbibliotheken. Für die Normdaten ist die Russische Staatsbibliothek (RSL) in Moskau zuständig; sie nimmt bereits testweise an VIAF teil. Die Suche über den RSL-OPAC ist relativ kompliziert. Ein direkter Normdatenlink wäre hilfreich und für die Vorlage eine Bereicherung. (Vor allem im Hinblick darauf, dass andere Sprachversionen der Wikipedia die Links gerne übernehmen.) --Kolja21 (Diskussion) 18:03, 10. Mai 2012 (CEST)
Es ist noch keine Lösung, aber vielleicht eine Piste: Die BnF verwendet ARK, sodass man den Eintrag von Alexandre Dumas auch unter http://data.bnf.fr/ark:/12148/cb119010630 erreicht. Der Teil vor dem Zahlencode ist so gut wie fest, die letzte Ziffer kann auch ein Buchstabe sein. Wonach sich diese "Prüfstelle" richtet, habe ich noch nicht herausgefunden. --Monsieur Becker (Diskussion) 19:23, 10. Mai 2012 (CEST)
Hier die mögliche Lösung [8] --Monsieur Becker (Diskussion) 19:34, 10. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Parameterhäufigkeit in de:WP

Der Dump 20120508 enthält 210.811 Verwendungen der Vorlage:Normdaten, dabei sind die einzelnen Parameter wie folgt verteilt:

BNF     -      37
DNB     -       5
EST     -      58
FIDE    -       4
FRBN    -       1
FRBNF   -       1
FRBNF1  -       1
GK-V1   -       1
GKD     -    6062
GKD-V1  -     489
GKD-V2  -      63
GKD-V3  -       3
GKD-V4  -       2
GKG     -       1
GND     -     195
GND-TICKET -    1
GND2    -       1
HBZ     -       1
IPI     -       1
IS-REDIRECT -   1
IVAF    -       1
LAC     -       1
LCCD    -       1
LCCN    -  111978
LCCN2   -       2
NOTES   -      50
OCLC    -       2
PDF     -       1
PND     -  177642
PND2    -       3
PPN     -       1
REDIRECT -      2
SELIBR  -    2548
SELIBR2 -       1
SWD     -    7440
TESTCASE -      7
TIMESTAMP -    37
TSURL   -      54
ULAN    -       6
VAF     -       1
VIAF    -  135480
VIAF-1  -      14
VIAF2   -      21
VIAF3   -       2
WORLDCATID -   24
WP      -     346

Ich fange nachher mal an, Ausreisser zu bereinigen, denn von der Vorlage berücksichtigt sind derzeit nur EST, GKD, GKD-V1, GKD-V2, GND, LCCN, PND, SELIBR, SWD, VIAF, die ominöse WORLDCATID (und der Steuer-Parameter WP) und auch die Vorlagendokumentation erwähnt nicht mehr. -- Thomas Berger (Diskussion) 12:31, 10. Mai 2012 (CEST)

Das TSURL dürfte aus Kopien von der Authority-control-Vorlage auf den Commons kommen (hier auf de völlig verzichtbar), ULAN und BNF und ein paar andere wohl auch. --AndreasPraefcke (Diskussion) 12:40, 10. Mai 2012 (CEST)
Der Steuerparamter WP ist bei WP=1 verzichtbar (das haben manche eingetragen, die unbedingt den Apper-Tool-Link wollten, ohne dass irgendwelche Normdaten vorhanden waren), bei WP=0 nicht (das sind die Familienartikel mit PND aber ohne Apper-Tool-Eintrag, da nicht in "Mann" oder "Frau"). --AndreasPraefcke (Diskussion) 12:42, 10. Mai 2012 (CEST)
WP=1 ist fast dasselbe wie TYP=p, WP=0 dasselbe wie TYP != p. Ausnahme die Familien und Mickey Mouse was dann darauf beruht, dass das an der Personendaten-Vorlage sich manifestierende Wikipedia-Konzept von "Person" nicht ganz deckungsgleich mit dem der oder einiger Normdateien ist. Ich finde nicht, dass man diese Diskrepanz in Zukunft durch einen WP-Parameter steuern muss (und bin ohnehin tendenziell eher für eine Ausweitung der Persondendaten auch auf Nicht-Ganz-Personen). -- Thomas Berger (Diskussion) 13:35, 10. Mai 2012 (CEST)
OK. Es sind ja auch wirklich nicht so viele, wie ich dachte. Vielleicht könnte das APPER-Tool in solchen Fällen von nicht gefundenen Links aus der Wikipedia eine schönere Fehlermeldung auswerfen ("Nicht gefunden - kann daran liegen, dass die Datenbank nicht ganz aktuell auf dem Stand der Wikipedia ist oder dass es sich um fiktive Personen oder Familien handelt.") --AndreasPraefcke (Diskussion) 13:46, 10. Mai 2012 (CEST)
WORLDCATID m. E. verzichtbar. Den Link auf WorldCat sollte das Apper-Tool bieten, nicht die Normdatenleiste. Was das genau soll, kapiert wohl eh nur User:Gangleri. --AndreasPraefcke (Diskussion) 12:43, 10. Mai 2012 (CEST)
Die - an WORLDCATID oder LCCN gebundene - Funktion (Verlinkung auf einen bestimmten Katalog) ist bereits fragwürdig. Der Parameter WORLDCATID ist zudem ein dedizierter Nicht-Identifier: Dort, wo kein Normsatz mit LCCN vorhanden ist, erfolgt die Verlinkung auf die Trefferanzeige mittels einer vom Namen (etwa Christine Spindler -> np-spiindler%2C+christine) oder einer (historischen? oder vom Nicht-LCCN-Normsatz abggeleiteten?) VIAF-Nummer (etwa Hildegard Kremper-Fackner -> viaf-67140428) abgeleiteten Zeichenkette. Wir wissen nichts über Persistenz, im Zweifel könnte diese Namens-Verlnkung spontan zu funktionieren aufhören, sobald eine LCCN für die Person existiert. -- Thomas Berger (Diskussion) 14:06, 10. Mai 2012 (CEST)
Danke für die Liste aus dem Dump! Die ist eine riesen Hilfe, da ich mich jetzt nicht mehr auf mein Bauchgefühl verlassen muss. "TESTCASE" klingt abenteuerlich und Fälle wie "PDF"/"IVAF" sind vermutlich Tippfehler, aber den Parameter "TIMESTAMP" könnten wir übernehmen (mit der Normierungsangabe "Jahr-Monat-Tag"). Auf die Parameter "GKD-V1 ..." würde ich verzichten; die machen sowohl den Quellcode wie die Dokumentationsseite nur noch für Experten lesbar. --Kolja21 (Diskussion) 17:32, 10. Mai 2012 (CEST)

Hallo Thomas, wollte eben beim Aufräumen der falschen bzw. überflüssigen Parameter helfen, musste aber feststellen, dass du die meisten offenbar schon abgearbeitet hast. Thanx! --Kolja21 (Diskussion) 01:02, 11. Mai 2012 (CEST)

Ja, inzwischen müsste ich durch sein. Habe allerdings BNF und GKD-V-irgendwas gelassen, im Gegensatz zu Dir aber auch beiläufig "TIMESTAMP" gelöscht... -- 01:27, 11. Mai 2012 (CEST)

Das wollte ich vorhin nachholen, aber du warst wie gesagt schneller. Hoffe, es geht bald mit der GND los. Gruß --Kolja21 (Diskussion) 02:21, 11. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

GND in Wikipedia: Umsetzung / Zeitplan

Zwei Optionen:

a) wir warten auf die (fast) perfekte Vorlage, die vorerst alle alten Parameter mit einbeziehen muss, die später gelöscht werden oder
b) wir legen jetzt die Werte für den Parameter "TYP" fest, nutzen die GND und beginnen die Parameter, die wegfallen können/sollen abzuarbeiten.

--Kolja21 (Diskussion) 01:12, 11. Mai 2012 (CEST)

Ich hab jetzt einfach alle Parameter, die wir nicht mehr wollen (SELIBR=, GKD-V1 etc., WORLDCAT) rausgeschmissen, NDL rein, PND/GKD/SWD/EST behalten und ein bisschen herumprogrammiert:

Die Vorlage kann:

  • TYP=p,k,v,w,s oder g. Der Typ wird nur angezeigt, falls GND eingetragen ist (in Klammer hinter der Nummer). Für die, die Personendaten eingeblendet haben, wird der Typ auch angezeigt, wenn noch keine GND eingetragen ist (dann direkt hinter "Normdaten:"), und "Typ fehlt" wird diesen Nutzern bei allen Einbindungen der Vorlage angezeigt. Alle GND-Eintragungen ohne TYP und alle TYP-Eintragungen, die nicht p, k, v, w, s oder g sind, lassen eine fette Fehlermeldung anzeigen und erscheinen in einer Wartungskategorie. Die Fehlermeldung erscheint bei allen, nicht nur bei denen, die Personendaten eingeblendet haben. Durch die Kategorie kann man die Einblendung sicherlich immer sehr kurz halten, sie ist aber wichtig, damit alle Wikipedianer, die das machen wollen, das mit dem Typ schnell lernen.
  • Apper-Tool-Verlinkung falls TYP=p, falls nicht trotzdem, wenn PND oder LCCN oder VIAF oder NDL eingetragen sind. VIAF hat ja neuerdings nicht mehr nur Personen drin, das ist also nicht 100% sauber, aber bei uns dürften es wohl 99,99% Personen sein. Das kann aber nach Abschluss der gesamten Umstellung dann eh wegfallen und nur noch bei TYP=p angezeigt werden.
  • GNDfehlt (Werte: leer/"ja" oder "1" oder was auch immer); GNDName (für die GND-Nr. der Namensdatensätze); GNDCheck (mit Wartungskategorie falls GNDfehlt nicht leer, Kategorie pro Monat falls auch GNDCheck vorhanden; jedoch ohne Fehlerroutine, falls da jemand andere Formate einträgt; also verbesserungsfähig); REMARK (freies Anmerkungsfeld). All das wird nur angezeigt für die, die Personendaten eingeblendet haben. Die Wartunskategorie ist aber natürlich davon unabhängig.
  • WP ist noch drinnen und zeigt bei WP=1 das Apper-Tool an, da ansonsten eine leere Leiste angezeigt würde bei den {{Normdaten|WP=1}}-Einbindungen.

Die Vorlage kann m. E. jetzt sowohl alle bisherigen Einbindungen korrekt anzeigen als auch alle neuen mit GND mit und ohne TYP. Was würde denn jetzt noch für eine schnelle Umsetzung fehlen? Sind andere Parameternamen gewünscht? --AndreasPraefcke (Diskussion) 10:37, 11. Mai 2012 (CEST)

Das sieht sehr gut aus! Finde, dass wir das schnell umsetzen sollten und dann über die nächsten Schritte extra beraten sollten. --APPER\☺☹ 11:58, 11. Mai 2012 (CEST)
+1 (= ich habe jetzt genug an der Vorlage geändert) --Schnark 12:44, 11. Mai 2012 (CEST)
Kann es sein, dass die Wartungskategorie aus GNDCheck nur dann abgeleitet wird, wenn gleichzeitig auch GNDfehlt besetzt ist? Das wäre nicht gut. -- Thomas Berger (Diskussion) 13:44, 11. Mai 2012 (CEST)
Das habe ich jetzt geändert. --AndreasPraefcke (Diskussion) 13:49, 11. Mai 2012 (CEST)

Bei den Commons funktionieren GND und TYP auch schon. An en.wikipedia trau ich mich nicht heran (sehe gerade: GND hat schon jemand gemacht dort, TYP ist ja auch egal, bei Copy&Paste richtet es ja keine Schäden an, auch wenn es noch nicht eingebaut ist). --AndreasPraefcke (Diskussion) 13:37, 11. Mai 2012 (CEST)

Kann mir mal jemand die Namen der mind. 195 Artikel irgendwohin posten, die GND= schon verwenden? Die will ich ungern auf einmal mit Fehlermeldung ausstatten und würde daher gerne vorher den TYP eintragen. --AndreasPraefcke (Diskussion) 13:39, 11. Mai 2012 (CEST)

Benutzer:Gymel/GNDPrelim -- Thomas Berger (Diskussion) 13:58, 11. Mai 2012 (CEST)
Jetzt allemit TYP. --AndreasPraefcke (Diskussion) 16:04, 11. Mai 2012 (CEST)

 Ok Wikipedia:Normdaten, Hilfe:Normdaten sind umgestellt. Doku zu Vorlage:NormdatenTemp/Doku existiert. --AndreasPraefcke (Diskussion) 16:43, 11. Mai 2012 (CEST)

 Ok Hilfe:GND ist jetzt auch aktuell. --AndreasPraefcke (Diskussion) 16:52, 11. Mai 2012 (CEST)

Dummerweise können wir Vorlage:DNB-Portal noch nicht mit TYP versehen und entsprechende Hilfe-Texte verfassen, da da erst ein Bot alle Vorkommen TYP in TEXT ändern müsste. --AndreasPraefcke (Diskussion) 16:52, 11. Mai 2012 (CEST)

 Ok Die Vorlage ist jetzt durch die neue ersetzt. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Noch nicht geklärte Frage: BNF

Sollen wir die BNF jetzt kurzfristig noch mit aufnehmen oder doch nicht? Ich hätte nichts dagegen, viel bringen tut's aber auch nicht (da in VIAF meist sehr gut aggregiert). --AndreasPraefcke (Diskussion) 17:46, 11. Mai 2012 (CEST)

Muss nicht sein. --Kolja21 (Diskussion) 22:32, 11. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Beschwerde: WorldCat

Eine Beschwerde gab es schon. Soll ich ihn wieder reinmachen (ohne den Parameter, einfach nur über LCCN)? Oder bekommen wir das kurzfristig ins Apper-Tool (über eine Verlinkung beim Feld LCCN?) Dann könnte man darauf verweisen. --AndreasPraefcke (Diskussion) 17:47, 11. Mai 2012 (CEST)

Bitte draussen lassen. Der Irrglaube, es ginge bei den Normdaten um Bibliothekskataloge ist auch so schon kaum auszurotten. -- Thomas Berger (Diskussion) 18:15, 11. Mai 2012 (CEST)
Ist (wenn LCCN vorhanden) jetzt auch an erster Stelle bei den "Weiteren Links" in meinem Personentool. --APPER\☺☹ 18:17, 11. Mai 2012 (CEST)
Das war ja schnell wie der Blitz, Apper. Super, jetzt habe ich eine Antwort auf solche Fragen. --AndreasPraefcke (Diskussion)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Kommentare zur runderneuerten Vorlage

Erstmal tausend Dank an Andreas! Ich denke auch, dass der WorldCat im Personentool am besten aufgehoben ist. (WorldCat stellt kein Normdaten zur Verfügung, sondern verwendet sie lediglich als Suchkriterium.) Drei kleine Anmerkungen:

  1. Samuel Glasstone: Bei der Ausgabe "Normdaten (Typ fehlt)", wäre ein Link hilfreich. Z.B.: "Normdaten (Typ fehlt)". Am besten wäre ein Link auf Hilfe:Normdaten, aber dort findet sich die Entitätenliste (aus historischen Gründen) im Moment noch etwas versteckt am Ende des Textes.
  2. Rebecca Abe: Wieso steht hier: "Normdaten (Typ p): PND: 128712309 (PICA) ..."? Das verwirrt, da der Typ sonst in Klammern hinter der GND angegeben wird. Auch den PICA-Link würde ich rausnehmen, sonst vermisst man ihn nachher bei der GND.
  3. Rudi Studer: Vor "Anmerkung" fehlt der senkrechte Strich, der die Trennung markiert ("GND-Namensdatensatz: 110201841 Anmerkung: ...").

--Kolja21 (Diskussion) 20:48, 11. Mai 2012 (CEST)

Habe die neue Vorlage jetzt eine Nacht lang getestet und bin begeistert. Als größte Verbesserung empfinde ich die Zusammenlegung mit der PNDfehlt-Vorlage und damit verbunden die Anlage der neuen Wartungskategorie (Kategorie:Wikipedia:GND fehlt). Was haltet ihr davon, für alle Leser die Angabe "Normdaten (Person): ...", "Normdaten (Sachbegriff): ..." etc. anzeigen, statt die Kürzel "GND (p)" und "GND (s)" zu verwenden? Der OGND-Katalog macht das bereits[9]; außerdem bezieht sich der Parameter TYP nicht nur auf die GND. --Kolja21 (Diskussion) 06:05, 12. Mai 2012 (CEST)
Sehr dafür, denn die Kürzel erschließen sich sonst nur Eingeweihten. --Monsieur Becker (Diskussion) 09:17, 12. Mai 2012 (CEST)
+1. Das ist wirklich ziemlich kryptisch im Moment.--Berita (Diskussion) 09:54, 12. Mai 2012 (CEST)

OK, ich mach mich mal dran. --AndreasPraefcke (Diskussion) 11:26, 12. Mai 2012 (CEST)

Das sähe dann so aus: Benutzer:AndreasPraefcke/Baustelle2 --AndreasPraefcke (Diskussion) 11:41, 12. Mai 2012 (CEST)

Find ich super so. --APPER\☺☹ 12:39, 12. Mai 2012 (CEST)

+1. Die neue Vorlage ist rundum gelungen! Nur was den Link betrifft, korrigiere ich mich. Besser als auf [[Hilfe:GND#Entitätenliste|Typ fehlt]] zu verlinken, wäre es Vorlage:Normdaten#Kopiervorlage zu wählen, dann erfährt man gleich, wie man den Parameter eintragen kann. Gruß --Kolja21 (Diskussion) 15:34, 12. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Weitere Anmerkungen

Hi, war leider die letzten Wochen wegen Offline-Projekten leider nicht in der Lage, hier bei der Umstellung mitzuhelfen. Jedenfalls tolle Arbeit bei der Umstellung! Und vielen Dank an Andreas und Kolja21 für die Aktualisierung von Hilfe:Normdaten! Hab zur ganzen Sache noch einige Anmerkungen:

  1. Was passiert mit den GKD-Vorgänger-Versionen (GKD-V1, V2, V3), sind die ersatzlos gestrichen? Ist zum einen praktischer, weil es da ja teilweise mit den Vorgängern, Nachfolgern und parallel existierenden Körperschaften schonmal recht chaotisch sein konnte. Andererseits haben wir damit viele Fälle, wo Vorgänger-Körperschaften auch im selben Artikel behandelt werden, aber durch den Wegfall nicht alle zutreffenden GKD-Nummern dem Artikel zugeordnet werden können, wodurch sie auch von externen Diensten nicht mit dem Artikel verknüpft werden können.
  2. Die Parameternamen für TYP sind eventuell etwas kryptisch. Außer uns paar Eingeweihten gibt es ja inzwischen durchaus eine ganze Reihe "normaler" User, die die Normdaten-Vorlage in neue (meist Personen-)Artikel eintragen. Und in den letzten Jahren ging der Trend auch immer mehr weg von kryptischen Parameternamen in Vorlagen, Infoboxen, etc.. hin zu selbsterklärenden Parameternamen. Persönlich hätte ich wahrscheinlich Parameternamen wie "Person", "Werk", "Schlagwort" bevorzugt.
  3. Bei fiktiven Figuren mit dem Parameter "WP=0" wird jetzt wieder der Link zur Personensuche angezeigt, der aber aufgrund der fehlenden Personendaten ins Leere läuft. Hier wäre eventuell ein Parameter für rein fiktive Figuren hilfreich.
  4. Wegfall von SELIBR finde ich auch gut, hatte wahrscheinlich eh nur eine sehr begrenzte Nützlichkeit.
  5. Ebenso der Wegfall des Worldcat-Links bzw die Verlegung auf APPERs Personentool. Eventuell wäre als Ersatz für den Parameter WORLDCATID eine Vorlage á la Vorlage:DNB-Portal nützlich, jedenfalls für die Fälle, wo der Link einen Mehrwert bietet.
  6. Wird es in Folge der ganzen Änderung noch einen Botlauf geben, um alle Einbindungen zu aktualisieren und auf Vordermann zu bringen?

Gruß, --Kam Solusar (Diskussion) 06:18, 12. Mai 2012 (CEST)

Einige Antworten:
  • Die Nummern von Vorgängerkörperschaften entfallen tendenziell, es gibt sie ja nicht nur in der Ex-GKD, sondern der ganze Mechanismus wurde eigentlich bereits letztes Jahr fragwürdig, als VIAF auch Körperschaften nachzuweisen begann. Wir werden analog den Autorenduos etc. die Redirect-Seiten zu Vorgängerkörperschaften bei Bedarf mit eigenen, vollständigen Normdaten-Vorlagen ausstatten müssen.
  • Typen wären aber auch "Gottheit", "Manuskript", "Sachbegriff", "Organisation" usf.: Da gäbe es ganz schön viel, das auch nicht falsch ist, aber für die Benennung oder Codierung gerade nicht gewählt wurde...
  • APPER hatte versprochen, die fiktiven auch zu berücksichtigen. Es wird allerdings nicht in allen Fällen funktionieren, die Artikelautoren von der Aufnahme der Vorlage:Personendaten zu überzeugen?
  • Vorlage:Worldcat id?
  • Körperschaften und Schlagworte sind in der GND auf Körperschaften, Schlagworte, Veranstaltungen, Geographika und Werke neu aufgeteilt worden, das wird ein Botlauf machen. Ebenso die Integration der ca. 17.000 Verwendungen von Vorlage:PNDfehlt. Zum Nachtragen von TYP=p und Umwandeln von PND in GND in ca. 180.000 Fällen siehe weiter oben -- Thomas Berger (Diskussion) 09:24, 12. Mai 2012 (CEST)
Danke für die Erklärungen. Bei den Körperschaften hatte ich gar nicht an die Redirect-Lösung gedacht. Vorlage:Worldcat id kannte ich noch nicht, dann hat sich das "Problem" direkt erledigt. Bei den Typen sehe ich jetzt nicht das Problem, statt den jetzigen GND-internen Kürzeln jeweils eigene selbsterklärende Entsprechungen zu verwenden. --Kam Solusar (Diskussion) 19:27, 12. Mai 2012 (CEST)
Bei den fiktiven Personen kommen jetzt einige Infos und keine Fehlermeldung mehr. --APPER\☺☹ 14:04, 12. Mai 2012 (CEST)
Dankeschön! --Kam Solusar (Diskussion) 19:27, 12. Mai 2012 (CEST)
Um die Parameternamen für TYP hat die GND-Redaktion lange gerungen, wie man an den verschiedenen Papern und Entwürfen aus den letzten zwei Jahren erkennen kann. Besser könnten wir es auch nicht machen; nur das "k" für Körperschaft, hätte man durch "o" wie Organisation ersetzen können. (Die GND-Red. hat das Kürzel vermutlich aus hist. Gründen gewählt, in Memoriam Gemeinsame Körperschaftsdatei). Die Parameternamen sind fester Bestandteil der überregionalen GND (ÜGND) und werden sowohl vom DNB-Portal wie dem OGND-Katalog angezeigt. Eine eigene Kürzelliste zu erstellen, hätte der Verständlichkeit daher nicht gedient, und den Typ auszuschreiben, geht auch nicht, da die Vorlage sonst nicht in anderen Sprachen (falls die engl. Wikipedia ihre Vorlage umstellen will) verwendet werden könnte. --Kolja21 (Diskussion) 15:54, 12. Mai 2012 (CEST)
Organisation hätte mir auch besser gefallen, aber ich habe absichtlich "Körperschaft" in die Vorlage eingebaut, weil es nun mal mit dem k korrespondiert und wir nur so "didaktisch wertvoll" die Wikipedianer dazu bringen werden, sich dieses Zeug einfach zu merken. --AndreasPraefcke (Diskussion) 18:43, 12. Mai 2012 (CEST)
Schon klar, dass man sich bei der DNB die Kürzel nicht mal eben beiläufig ausgedacht hat. Nur ist die Frage, ob wir die GND-internen Typen-Kürzel 1:1 bei uns verwenden müssen/sollten. Bei der Übernahme in andere Sprachen hat man jetzt auch schon das Problem der Verständlichkeit, da "k" für Körperschaften oder "v" für Veranstlungen im Englischen z. B. auch wenig Sinn haben. Die problemlose Nutzung in allen Wikimedia-Projekten wäre zwar wünschenswert, ist aber auch durch die Änderungen wie etwa die Ergänzung der PND-Funktionalität leider teilweise nicht ohne manuelle Korrekturen möglich. Da müßte man eventuell ,aö ein Meta-Normdaten-Projekt auf die Beine stellen, um die Einbindung von Normdaten und ihre Verwendung projekt- und sprachen-übergreifend zu diskutieren und zu regeln. --Kam Solusar (Diskussion) 19:27, 12. Mai 2012 (CEST)
Das muss m. E. eine Priorität für WikiData sein, sobald das mal läuft. --AndreasPraefcke (Diskussion) 20:02, 12. Mai 2012 (CEST)
Die VIAF-Datensätze stehen ja unter einer freien Lizenz, die IMO unseren Anforderungen entspricht. Es sollte also kein Problem sein, VIAF-Datensätze oder Teile davon nach Wikidata zu übernehmen und es dann den einzelnen Projekten zu überlassen, welche konkreten Normdaten sie jeweils in ihren Artikeln anzeigen wollen. Ich sehe da allerdings noch einige Schwierigkeiten, wie man die zu einem Artikel passenden Normdaten automatisch finden und abrufen soll. --Kam Solusar (Diskussion) 21:11, 12. Mai 2012 (CEST)
Hallo Kam, "o" wie Organisation, die bei PICA+ mit "Tb" abgekürzt wurde, da es sich um eine Körperschaft (GND, Typ k) handelt. Falls dir das noch zu einfach ist, stellt dir den Satz in der Übersetzung für en:Universal Authority File und eo:Universala Norma Datumaro vor. Daher kann deine Frage, "ob wir die GND-internen Typen-Kürzel 1:1 bei uns verwenden müssen/sollten", mit einem klaren "Ja" beantwortet werden. Die Kürzel werden von der DNB übrigens nicht nur intern verwendet, sondern im OPAC im Feld "Typ" (auch den Namen des Parameters haben wir mit der DNB abgeglichen) angezeigt. Gruß --Kolja21 (Diskussion) 20:36, 12. Mai 2012 (CEST)
Die GND-Daten sind aber nicht die einzigen Normdaten, die wir hier verwenden, deshalb müssten wir nicht unbedingt deren Kürzel 1:1 übernehmen. Programmiertechnisch macht es nicht den geringsten Unterschied, ob wir hier "p" oder "Person" nehmen. Deshalb sind die konkreten Kürzel, die wir hier für die verschiedenen Typen verwenden, IMO einzig für die Wikipedianer wichtig, die damit jetzt in den Artikeln arbeiten müssen. --Kam Solusar (Diskussion) 21:11, 12. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

NDL-Api

Falls jemand http://iss.ndl.go.jp/ndla/sparql/ versteht, wäre ich ihm sehr dafür dankbar, wenn er mir eine URL zusammenbasteln könnte, die mir die Suchergebnisse für die Anfrage "Einstein, Albert" als JSONP liefert ([10] geht schon mal in die Richtung, aber all meine Versuche, das so abzuwandeln, wie ich es brauche, führten zu nichts.) --Schnark 10:38, 12. Mai 2012 (CEST)

Das Problem ist das Einstein oder wohl alle Nicht-Japaner kein ndl:transcription-Feld besitzen, weswegen die Abfrage fehlschlägt. Das kann man aber auch für Japaner weglassen und ist nur wichtig wenn man wissen will wie die Schriftzeichen gelesen werden. Für Einstein korrekt wäre:
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rda: <http://RDVocab.info/ElementsGr2/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX xl: <http://www.w3.org/2008/05/skos-xl#>
PREFIX ndl: <http://ndl.go.jp/dcndl/terms/>
SELECT * WHERE {
?uri1 foaf:primaryTopic ?uri2.
?uri1 xl:prefLabel [ xl:literalForm ?heading; ].
?uri2 rda:dateOfBirth ?birth.
?uri2 rda:dateOfDeath ?death.
?uri2 foaf:name "Albert Einstein".
}

--Mps (Diskussion) 11:42, 12. Mai 2012 (CEST)

Danke! --Schnark 11:48, 12. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Danke

Ich möchte mich bei allen Beteiligten für die konstruktive Diskussion und die notwendigen Arbeiten ganz herzlich bedanken. Das ist Wikipedia vom Feinsten. Leider konnte ich mich zeitlich bedingt inhaltlich nicht einbringen :-( — Raymond Disk. 12:03, 12. Mai 2012 (CEST)

Dem kann man sich nur anschließen, das habt ihr wirklich großartig gemacht. Ich habe einen Großteil der mit der Umstellung einhergehenden Debatten noch mal nachverfolgt und hab mich zeitweise gefragt, ob es wirklich unsere Wikipedia ist, in der so konstruktiv und freundlich miteinander gearbeitet wird. Was denkt ihr: Ein kurzer Kurier-Artikel zur Umstellung …? --Polarlys (Diskussion) 10:30, 14. Mai 2012 (CEST)

Ich denke, ein Artikel im Kurier wäre schon deshalb angebracht, um möglichst viele Autoren über die Änderung der Vorlage Normdaten zu informieren. Ansonsten werden wohl viele die alten Parameter weiterverwenden, man schaut ja nicht ständig wieder in die Dokumentation, wenn man regelmäßig Normdaten einpflegt.--Berita (Diskussion) 10:34, 14. Mai 2012 (CEST)
+ 1. Als "Nur"-Nutzer hatte ich die Seite auf der Beobachtungsliste und habe staunend mitverfolgt, was hier abgeht. Falls Ihr den Kurierartikel delegieren wollt, stehe ich auf Wunsch gerne zur Verfügung. Ich würde auch erstmal einen Entwurf machen, damit alles richtig ist…--emha d|b 10:59, 14. Mai 2012 (CEST)

Es freut mich sehr, dass hauptsächlich positivie Rückmeldungen kommen, ich habe die Atmospähre hier auch immer sehr geschätzt. Das Problem mit dem Mitteilen ist, dass Schnarks js-Skript noch nicht fertig war (nicht seine Schuld, ich habe die neue Vorlage absichtlich so schnell wie möglich eingeführt, ohne das abzuwarten, sobald die Vorlage fertig war, da sich ja eigentlich für alte Werte und Verfahrensweisen nichts ändern muss). Ich wollte das Skript aber unbedingt im Kurier mit promoten, da es für Personen- und Normdaten unglaublich viele Fehler verhindert und sehr komfortabel ist. Leider hat es aber noch einige Bugs, daher meine Zurückhaltung auch noch heute. Wenn jemand den Kurier-Artikel formulieren möchte: bitteschön, ich freue mich, wenn ich das nicht selbst machen muss. --AndreasPraefcke (Diskussion) 11:33, 14. Mai 2012 (CEST)

+1. Da die Änderungen rund 200.000 Artikel betreffen, ist wichtig, sie möglichst vielen Autoren zu vermitteln. Vielleicht findet sich auch der eine oder andere, der sie in anderen Sprachen bekannt macht. --Kolja21 (Diskussion) 14:53, 14. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Kurier-Artikel ist publiziert. --AndreasPraefcke (Diskussion) 14:07, 16. Mai 2012 (CEST)

Neue Version des Normdaten-Skripts

Übers Wochenende habe ich jetzt auch mein Normdaten-Skript (und Benutzer:Schnark/js/edithelper und Benutzer:Schnark/js/wikieditor) auf die neue Version der Vorlage umgestellt. Falls als Version nicht 4.0 angezeigt wird, bitte einmal den Browser-Cache leeren. Folgende Punkte halte ich für erwähnenswert:

  • Ich habe die neue Version zwar lokal getestet, das ändert aber nichts an der Tatsache, dass sie sicher noch Bugs enthält. In der ersten Zeit sollte man also besonders gründlich den angezeigten Versionsunterschied betrachten und mir sämtliche Fehler mit Angabe eines Artikels, in dem sie auftreten, melden; entweder auf meiner Diskussionsseite oder auf Benutzer Diskussion:Schnark/js/personendaten.js. Dies betrifft besonders den Umgang mit fehlenden oder nicht individualisierten PND.
  • Das Skript kümmert sich wie bisher nur um personenbezogene Normdaten. Falls es jemand gibt, der das Skript gerne auch für andere Normdaten verwenden würde, kann mir auf meiner Diskussionsseite mitteilen, wie er sich das im Idealfall vorstellt (welche Felder sollen direkt bearbeitbar sein, wo könnten Vorschläge herkommen, welche Suchen müssen verlinkt werden, etc.)
  • Das Skript bemüht sich, alles inklusive {{PNDfehlt}} auf die neue Version umzustellen, dabei werden alle alten Parameter (insbes. SELIBR) entfernt, die anderen umgestellt.
  • Dank Mps konnte ich die Vorschläge für NDL direkt integrieren, ob das in der Praxis auch so schön funktioniert wie in der Theorie, weiß ich aber nicht. Wer aus Ideologie-, Paranoia- oder sonstigen Gründen keine Skripte von einem fremden Server laden will, kann den in der Dokumentation beschriebenen Parameter disableExternal nutzen, der den bisherigen Parameter disableVIAF ablöst, letzterer wird noch für eine Übergangszeit ausgewertet.

--Schnark 09:29, 14. Mai 2012 (CEST)

Hallo. Mir ist gerade aufgefallen dass man die NDL-SPARQL-Abfrage im Vergleich zu meiner oben genannten, abändern sollte auf
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX rda: <http://RDVocab.info/ElementsGr2/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX xl: <http://www.w3.org/2008/05/skos-xl#>
PREFIX ndl: <http://ndl.go.jp/dcndl/terms/>
SELECT * WHERE {
?uri1 foaf:primaryTopic ?uri2.
?uri1 xl:prefLabel [ xl:literalForm ?heading; ].
OPTIONAL { ?uri2 rda:dateOfBirth ?birth. }
OPTIONAL { ?uri2 rda:dateOfDeath ?death. }
?uri2 foaf:name "<HIER NAME EINTRAGEN>".
}
da er sonst keine lebenden Personen findet (weil dann das Feld rda:dateOfDeath nicht vorhanden ist) oder personen mit unbekanntem Geburtsdatum. --Mps (Diskussion) 15:59, 14. Mai 2012 (CEST)
Ich tu alles, was du mir sagst. --Schnark 10:02, 15. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

NDL

Bis jetzt sind ja nur ganz wenige NDL eingetragen (ich hab mal alle japanischen Nobelpreisträger gemacht). Wie funktioniert denn die Verbindung der NDL zur ja.wikipeda? Wenn man sich ab http://id.ndl.go.jp/auth/ndlna/00000001 mit "+1" durch die URLs bewegt, kommt z. B. schon bei http://id.ndl.go.jp/auth/ndlna/00000004 ein Eintrag in der ja.wikipedia, der dann in ja.wikipedia auch einen Interwiki-Link nach de hat. Im ja-Quelltext steht aber, soweit ich sehe, nichts von Normdaten drin. Idee: Man könnte die bei der NDL vorhandene Verlinkung zu ja.wikipedia nutzen, um in dieser Form die möglichen NDL automatisch einzutragen oder wenigstens mal eine Liste zu generieren mit NDL-Nr., NDL-Lebensdaten, ja.Artikel, de.Artikel, vielleicht noch aus den Personendaten die de-wikipeda-Lebensdaten (Ich glaube, die Links bei der NDL sind vielleicht nicht immer topaktuell, ich habe in dem Feld bei der NDL auch mal eine Begriffsklärung verlinkt gesehen). Man könnte natürlich netterweise auch erst einmal die NDL fragen, ob sie eine Tabelle bereitstellen könnten NDL -> ja.wikipedia --AndreasPraefcke (Diskussion) 13:34, 14. Mai 2012 (CEST)

Spannendes Thema: Ich wusste bislang weder, dass die NDL zu Wikipedia verlinkt, noch, dass sie offenbar im Gegensatz zur DNB die Verlinkung selbst recherchieren. --Kolja21 (Diskussion) 15:07, 14. Mai 2012 (CEST)
Hm, vielleicht ist das auch gar nicht recherchiert, sondern nur ein Link, sobald der Name in ja.wikipedia als Aritkel existiert. So etwas lässt eher auf diese Art der Verlinkung schließen. (Der bei Wikipedia portraitierte ist 1978 geboren, die Person im NDL-Satz 1918; könnte aber natürlich auch irgendein Tippfehler dort sein). Dass ich wie gesagt auch schon BKL verlinkt gesehen habe, wäre ein weiteres Indiz dafür. --AndreasPraefcke (Diskussion)
Stimmt, da steht grob übersetzt: "Wikipedia-Suche von ..." --Kolja21 (Diskussion) 01:04, 16. Mai 2012 (CEST)
Aha. Ich schreib da mal eine Warnung in die Hilfe:Normdaten#NDL. Ich hab mal noch die biographischen Artikel über Japaner >20.000Bytes und ein paar Dutzend Tennos eingetragen. Sobald das bei uns mal größere Maße angenommen hat, könnten wir der NDL ja eine Art BEACON-Datei anbieten. --AndreasPraefcke (Diskussion) 12:10, 16. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

"Tonträgerfirma"

Was immer "dnbn" sein soll, Teil der GND ist das wohl (noch?) nicht, aber was machen wir mit solchen Einträgen? http://d-nb.info/dnbn/330135511 War in Akkordeon-Orchester Bad Vilbel in der Vorlage DM verlinkt. --AndreasPraefcke (Diskussion) 16:58, 14. Mai 2012 (CEST)

Ich hatte vor einigen Monaten dazu etwas zu recherchieren versucht: Fehlanzeige. Ich vermute ("bn"), dass es sich um eine interne Norm- (oder möglicherweise eher Adress-)datei des DMA im Zusammenhang mit dem "Bonner Katalog" handelt, die auch in ILTIS geführt wird. D.h. es hat in der Vorlage:Normdaten nichts zu suchen (und in den Vorlagen DNB-Portal und DNB funktioniert es ebenfalls nicht), weil wir normalerweise keine zusätzlichen Parameter für obskure und interne Normdateien von irgendjemandem ergänzen. (Und das würde sowieso nicht helfen, weil alle es als "PND" eintragen, höchstens irgendwann als "GND"). -- Thomas Berger (Diskussion) 17:53, 14. Mai 2012 (CEST)
In DNB-Portal funktioniert es Literatur von und über Normdaten/Archiv/002 im Katalog der Deutschen Nationalbibliothek --AndreasPraefcke (Diskussion) 20:00, 14. Mai 2012 (CEST)

Kommt häufiger vor:

--Kolja21 (Diskussion) 22:24, 14. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)

Links werden falsch erzeugt

Die Links von VIAF zur DNB werden grundsätzlich falsch erzeugt (Beispiel). Linkziel ist http://d-nb.info/gnd/http://d-nb.info/gnd/118799894. Seltsam.--84.161.214.14 22:18, 29. Mai 2012 (CEST)

Interessant. Habe mal meinen VIAF-Kontakt angeschrieben. Grüße --APPER\☺☹ 00:21, 30. Mai 2012 (CEST)

Ist ein Bug. Da hat jemand (offenbar aus Versehen) in der Vorlage den Link verdoppelt:

http://d-nb.info/gnd/http://d-nb.info/gnd/...

Vor ein paar Tagen hat die Verlinkung noch funktioniert. --Kolja21 (Diskussion) 01:29, 30. Mai 2012 (CEST)

Den Bug hatte ich wegen Redirect Cleaner gar nicht bemerkt. --Kam Solusar (Diskussion) 02:34, 30. Mai 2012 (CEST)

 OkScheint jetzt wieder zu funktionieren.--84.161.214.79 16:05, 30. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: 84.161.216.67 20:44, 16. Jun. 2012 (CEST)

Erweiterungsvorschlag: Library of Congress Subject Headings

Wir könnten analog zur deutschen Schlagwortnormdatei (SWD) auch die Schlagwortsammlung der Library of Congress als Parameter ergänzen. Damit würden Interessierte nicht nur Literatur in dt. Sprache zu den Themen finden, sondern auch in engl. Sprache.

Die Schlagworte lassen sich entweder über http://id.loc.gov/authorities/subjects.html finden oder über http://authorities.loc.gov/ . Erstere Seite führt zu Einträgen wie etwa [11] für Nordpol, bei zweiterer muss man sich erst durchklicken, bis man zu einer Seite wie [12] gelangt. Diese nutzen wir derzeit auch schon als Linkziel für LCCN-Einträge und hat den Vorteil, dass hier auch ein Link zu einer Suche nach entsprechenden Werken vorhanden ist. Bei ersterer Seite ist interessant, dass dort auch teilweise Links zu Einträgen in anderen Datenbanken vorhanden sind, siehe etwa bei [13]. --Kam Solusar 18:12, 4. Feb. 2012 (CET)

Nun, wenn niemand etwas dagegen einzuwenden hat, werd ich den Parameter LCSH mal in den nächsten Tagen ergänzen. --Kam Solusar 19:07, 22. Feb. 2012 (CET)
OK, eigentlich wollte ich heute nacht endlich den Parameter für LCSH ergänzen. Bin mir aber jetzt doch nicht ganz sicher. Die Library of Congress Subject Headings nutzen ja auch LCCNs als ID. Hier gibt es also dieselbe Situation wie etwa demnächst bei PND, GKD und SWD bei der Deutschen Nationalbibliothek. Die Frage ist, ob ein eigenständiger LCSH-Parameter noch Sinn macht, oder ob man besser die Änderungen an der Vorlage infolge der Zusammenlegung der DNB-Normdatenbanken (siehe unten) abwartet und dann einfach den LCCN-Parameter + Angabe des Normdatentyps dafür nutzt. --Kam Solusar (Diskussion) 03:04, 9. Mär. 2012 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.166.116 14:16, 24. Jun. 2012 (CEST)

Google, Freebase, Entities

Bin grad gestolpert über Direkte Antworten statt Linklisten (heise.de) Hab mir Freebase schon seit Ewigkeiten nicht mehr angeschaut, wusste auch nicht, dass die inzwischen bei Google sind. Könnte interessant sein: Blick über den Tellerrand, Inspiration für Verknüpfungsmöglichkeiten. – Falls am Wochenende schlechtes Wetter oder sonstwie Langeweile aufkommt, kann man dort zB ausgehend von http://www.freebase.com/view/en/albert_einstein mal herumschnuppern ;-) -- Make (Diskussion) 14:39, 15. Mär. 2012 (CET)

Gewünschte Liste

Wenn mir jemand (sobald ein neuer Dump da ist?) die GND-Werte der Artikel mit Vorlage:Theaterlexikon zusammenstellen könnte (PND sollte eigentlich nicht vorkommen, da ich alle Artikel beim Eintragen angefasst habe), wäre das eine schöne Vorarbeit für eine zu erstellende BEACON-Datei. Danke im voraus. --AndreasPraefcke (Diskussion) 19:39, 25. Jun. 2012 (CEST)

Hallo Andreas, das wäre [14]? -- Thomas Berger (Diskussion) 21:26, 25. Jun. 2012 (CEST)
Genau, dankeschön (ganz automatisch geht nicht, weil die Vorlage auch in thematisch nur verwandten Seiten und als Einzelnachweis in ganz anderen Artikeln eingesetzt wird). --AndreasPraefcke (Diskussion) 22:05, 25. Jun. 2012 (CEST) PS: Deine Datei scheint aber tatsächlich fehlerfrei zu sein (da nur Personen vorkommen und Dopplungen (etwa von "Fredy Lienhard") intelligent gestrichen wurden) --AndreasPraefcke (Diskussion) 22:09, 25. Jun. 2012 (CEST)
Klar, aber ein passenderes Extraktionstool hatte ich nicht, und ich war zu faul die Datei noch einmal zu editieren um ihre Herkunft zu verschleiern... -- Thomas Berger (Diskussion) 22:11, 25. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 09:40, 29. Jun. 2012 (CEST)

Arbeitsliste

Hallo Normdaten-Freunde. Heute habe ich für euch mal wieder eine schöne Wartungsliste ;). Zu finden unter Benutzer:APPER/GND. Wurde jetzt einmalig gefüllt, wird wohl eher nicht regelmäßig aufgefüllt. In der Liste sind Artikel mit VIAF-Nummer, der eine GND zugeordnet ist - im Artikel findet sich aber keine GND. Diese sollte natürlich ergänzt werden - außerdem sind das entsprechend alles Artikel, die durch das Fehlen der "PND" keinen "TYP"-Parameter haben - man schlägt also gleich zwei Fliegen mit einer Klappe ;) --APPER\☺☹ 19:46, 21. Jun. 2012 (CEST)

Achso: Es tauchen natürlich nicht nur Personen auf sondern auch Körperschaften etc. Die sind derzeit wohl erstmal einfach aus der Liste zu löschen bis die GKD/SWD zusammengeführt wurden. --APPER\☺☹ 19:48, 21. Jun. 2012 (CEST)
Zwei Beispiele probiert, eineinhalb Nieten gezogen: Bei Patrick Cassidy irrt VIAF (WP hat die Nummer bereits dem richtigen zugeordnet) und bei Bernard B. Brodie war GNDName vermerkt (war aber individualisiert). Beim "Nachtragen" anhand dieser Wartungsliste muss man also ziemlich auf der Hut sein, insbesondere normaten.js ist ja recht leichtgläubig, was VIAF-Angaben angeht... -- Thomas Berger (Diskussion) 22:33, 21. Jun. 2012 (CEST)
Ja, das ist auch der Grund, wieso ich da keinen Bot rangesetzt habe - man muss da schon alles von Hand anschauen --APPER\☺☹ 22:42, 21. Jun. 2012 (CEST)
zB Thomas Gesterkamp hat via WP:PND/F (Anfrage im September 2011) einen individualisierten Datensatz bekommen. Per "Links auf diese Seite" kann man das ja fix prüfen, und dann ggf. auch bei den PND-Anfragen abhaken. -- Make (Diskussion) 23:55, 21. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: Ist abgearbeitet. --AndreasPraefcke (Diskussion) 14:58, 1. Jul. 2012 (CEST)

Bitte um Hilfe

Die neue Vorlage hat noch das Problem, dass sie auch eingeblendet wird, wenn sie ganz leer ist {{Normdaten}} oder wenn nur {{Normdaten|TYP=g}} oder so etwas drin steht (bei TYP=p soll sie ja eingeblendet werden, immerhin gibt's dann den Personensuche-Link). Für die Leute mit Metadaten-Anzeige soll sie immer angezeigt werden, wenn sie da ist, denn man kann sie dann ja löschen oder was eintragen, und es ist gut, wenn das die erfahrenen Wikipedianer schon in der Artikelansicht sehen.

Ich habe das in der Testvorlage Vorlage:NormdatenTemp zu verbessern versucht, und an sich passiert genau das, was ich will, und es kommt beim Parsen {{Normdaten|TYP=g}} das raus:

<span class="metadata"><div id="normdaten" class="catlinks normdaten-typ-g">'''Normdaten (Geografikum):''' <span class="metadata"></span></div></span>

Sieht dann so aus (bitte auch mal ausgeloggt anschauen, sofern das Helferlein "Metadaten anzeigen" aktiviert ist):

<span class="metadata"><div id="normdaten" class="catlinks normdaten-typ-g">'''Normdaten (Geografikum):''' <span class="metadata"> </span></div></span>

Ich dachte, das zeigt dann einfach gar nichts an für Benutzer ohne angeschaltete Metadaten, aber es kommt so ein breiter, dünner, leerer Streifen mit dem Kasten raus. Was ist falsch daran? Es hat wohl mit dem "div" zu tun. Ich kenne mich damit leider nicht aus. --AndreasPraefcke (Diskussion) 13:23, 12. Mai 2012 (CEST)

<span><div></div></span> wird von Browsern andersrum geparst, also als ob das span im div ist. Hängt damit zusammen, dass ein span "inline" ist und keinen Block (div) enthalten kann. Einfachste Lösung ist, statt eines span ein div außenrum zu nehmen. Keine Ahnung, ob das irgendwelche Seiteneffekte hat, aber hier funktionierts erstmal:
--APPER\☺☹ 13:53, 12. Mai 2012 (CEST)

Super, danke, das scheint zu funktionieren. --AndreasPraefcke (Diskussion) 14:05, 12. Mai 2012 (CEST)

Ist es denn notwendig, ein eigenes Element extra für die Klasse "Metadata" drumherum zu setzen? Oder könnte man einfach den Normdaten-DIV noch um die Metadata-Klasse ergänzen und sich den zweiten DIV/SPAN sparen:

--Kam Solusar (Diskussion) 18:33, 12. Mai 2012 (CEST)

Wer das einfacher machen kann, möge es bitte tun (gerne in der Testvorlage Vorlage:NormdatenTemp). Ich bin auch nicht sehr zufrieden mit dem Spaghetti-Code, der das gerade erledigt. Mir fehlen leider tiefere Kenntnisse zu div IDs und classes. --AndreasPraefcke (Diskussion) 18:42, 12. Mai 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:21, 7. Jul. 2012 (CEST)

Hilftexte erwünscht / Wartungskategorien

Wann soll überhaupt die Normdatenvorlage als Wartungskategorie eingebaut werden, wenn keine Normdaten vorhanden sind? Bei jedem, zu dem ein Werk in einem Namensdatensatz steht, auf jeden Fall. Bei jedem, der so heißt wie ein Namensdatensatz? Bei jedem färoischen Politiker und indonesischen Badmintonsportler, egal wie er heißt? Vielleicht "bei Autoren, Komponisten, Musikern, Wissenschaftlern und Herrschern"? Oder nur bei deutschsprachigen? Oder doch überall, wobei dann vielleicht GNDfehlt nicht bejaht werden sollte, sondern nur das Datum der letzten Suche? Schon bei Vorlage:PNDfehlt war die Verwendung sehr disparat, es gibt doch so einige Eintragungen mit wenig Aussicht darauf, dass da jemals ein bibliothekarischer oder Normdateneintrag irgendwo entstehen sollte, und schon gar nicht in der GND. --AndreasPraefcke (Diskussion) 20:07, 12. Mai 2012 (CEST)

Weitere Frage: Was ist mit den Normdaten, wo z. B. VIAF und LCCN vorhanden sind, nicht aber GND (und auch kein Namenseintrag). Brauchen die eine Wartungskategorie? --AndreasPraefcke (Diskussion) 20:11, 12. Mai 2012 (CEST)

Ganz ehrlich: so 100%ig habe ich den Sinn der Vorlage "PNDfehlt" nie verstanden. Ich habe sie nur dann gesetzt, wenn ein zum verwechseln ähnlicher PND-Eintrag existierte (also z.B. "Meier, Hans *1952"), der aber eine andere Person betraf - sozusagen als Hinweis, dass da genauer geguckt werden muss. Wieso sonst alle Artikel damit ausgestattet sein müssen - keine Ahnung. --APPER\☺☹ 20:25, 12. Mai 2012 (CEST)

Das Problem, dass wir nicht in die Zukunft sehen können, werden wir nicht lösen können. Wie wollen wir festlegen, welche Person oder Personenkreis in Zukunft nicht relevant für die GND sein soll? Ich bin mit der Vorlage:PNDfehlt bislang auch sparsam umgegangen, aber jetzt, wo sie so galant in die Vorlage:Normdaten eingebaut ist, werde ich den Hinweis auf die fehlende GND häufiger verwenden. Langfristig könnte ich mir sogar vorstellen, dass die GND-Redaktion auch einen Wikipediaartikel als Grundlage für eine GND akzeptiert, schließlich verlinken die Bibliothekskataloge bereits hierher und auch in der Quellenangabe der Normdaten findet sich häufiger ein Verweis auf das Onlinelexikon. --Kolja21 (Diskussion) 20:47, 12. Mai 2012 (CEST)

Ich habe PNDfehlt bisher nur benutzt, wenn schon ein Name-Eintrag zu der Person in der DNB war, nur eben nicht personalisiert. Also letztlich, wenn deutschsprachige Veröffentlichungen von der Person existieren. Mir stellt sich in dem Zusammenhang die Frage, was "die Leute von der GND" wollen, was ist deren Ziel? Sind sie überhaupt daran interessiert, für Personen Datensätze einzufügen, von/zu denen es keine deutschsprachige Literatur gibt? An anderer Stelle wurde von einem halbjährlichen Rückstand in Bezug auf die Abarbeitung der Fehlerkategorie geschrieben, da sollte man auch abwägen, ob man diese Zusammenarbeit nicht irgendwann überstrapaziert.--Berita (Diskussion) 21:00, 12. Mai 2012 (CEST)

Die GND kennt keine Relevanzkriterien. Alles und jedes was von einer der beteiligten Institutionen erfasst wird (und das ist nicht nur die DNB), bekommt einen Normdatensatz. Wenn sich eine Bibliothek also entschließt, Zeitschriften oder langfristig vielleicht sogar Zeitungen auszuwerten, bekommen, wie schon jetzt üblich, Personen und Sachbegriffe eine GND, die nicht in Wikipedia aufgenommen werden. Theoretisch sind unsere Lemmata daher nur eine Teilmenge der GND. --Kolja21 (Diskussion) 21:12, 12. Mai 2012 (CEST)

Hier ein konkretes Beispiel: Ein Brief an Soma Morgenstern, geschrieben am 26. Juni 1973 und heute Teil seines Nachlasses (Deutsches Exilarchiv, Sign. EB 96/242-B.04.0004), reichte aus, dass die Verfasserin des Briefes einen Normdateneintrag erhielt. --Kolja21 (Diskussion) 21:38, 12. Mai 2012 (CEST)
Schon klar, dass irgendein deutschsprachiges Schriftstück ausreicht. Aber was ist mit Personen, die nur fremdsprachig publizieren oder gar dem von Andreas erwähnten Badmintonspieler?--Berita (Diskussion) 22:00, 12. Mai 2012 (CEST)
Gerade im Sportbereich gibt es wirklich viele nach unseren RK derzeit relevante Sportler, die nur in kaum beachteten Nischensportarten antreten. Dort gibt es vielfach außer Namen in Ergebnislisten und entsprechenden Daten in Online-Datenbanken so gut wie überhaupt keine schriftlichen Infos - also auch für die DNB auch so gut wie nichts, was man diesen Datensätzen zuordnen könnte. Hat es da viel Sinn, die DNB mit Anfragen zur Anlage von Normdatensätzen zu solchen Sportlern zu überhäufen, wenn es derzeit schon bei den bekannten Autoren, Filmschaffenden und Musikern noch immer Lücken gibt, denen man IMO Vorrang geben sollte? --Kam Solusar (Diskussion) 22:25, 12. Mai 2012 (CEST)
@Berita: Wieso Schriftstück oder wieso deutschsprachig? Schon ein Foto in einem Nachlass kann ausreichen, um, aus welchen Gründen auch immer, den Archivar zu bewegen, den Namen der betreffenden Person zu notieren und ihn in die GND einzutragen. Da sich die GND, wie gesagt, nicht auf Bücher aus der DNB beschränkt, sondern auch Tondokumente und den Bestand anderen Bibliotheken und Institutionen umfasst, nimmt sie alles auf, was gesammelt werden kann oder Menschen interessiert. Auch für die Anzahl der beteiligten Institutionen gibt es keine festgelegte Obergrenze. Die DNB ist schon jetzt international stark vernetzt, und es ist durchaus möglich, dass sich in Zukunft auch Institutionen aus dem nicht-deutschsprachigen Ausland an der Normdatei beteiligen. --Kolja21 (Diskussion) 22:40, 12. Mai 2012 (CEST)
@Kam: Solche Anfragen (Eintragung von Sportlern) gibt es nicht und hätten auch keinen Erfolg. Bislang ist nicht vorgesehen, Personen aus Wikipedia in die GND aufzunehmen, sondern der Weg läuft in der entgegengesetzen Richtung. Wir melden über WP:PND/F Fehler, wie falsche Zuordnungen, nicht individualisierte Datensätze oder Dubletten, die in der GND vorhanden sind. Wenn bislang kein Archivmaterial über Person x erschlossen ist, bekommt diese keine GND, egal wie relevant oder berühmt sie ist. --Kolja21 (Diskussion) 22:51, 12. Mai 2012 (CEST)
Schon klar. Ich wollte damit ausdrücken, dass es bei solchen Personen IMO wenig Sinn hat, die Artikel noch explizit mit Wartungskategorien und Normdatenvorlagen-Parametern zu versehen, die auf eine nicht vorhandene GND-Nummer hinweisen. Ich finde solche Hinweise implizieren irgendwie, dass die fehlenden GND-Datensätze in diesen Fällen Mängel in der GND darstellen und dass wir danach auf die DNB warten müssen, bis die sich endlich darum kümmern. Solche GND-fehlt-Hinweise sollten also nur dann genutzt werden, wenn man realistisch davon ausgehen kann, dass in solche Datensätze in absehbarer Zukunft angelegt werden könnten. --Kam Solusar (Diskussion) 00:22, 14. Mai 2012 (CEST)
Aber was ist realistisch? Dass sich der färoische Politiker sein Leben lang auf Lokalpolitik beschränken und nie ein Buch schreiben wird, und auch sonst nie auffallen? (Eine Festschrift zum 60. Geburtstag reicht schon aus.) Wir können nur schätzen und vermuten, aber Gewissheit haben wir erst, wenn wir in der GND nachgeschlagen haben. --Kolja21 (Diskussion) 00:37, 14. Mai 2012 (CEST)
Bei Politikern würde ich dir da ja auch noch zustimmen. Die LoC hat z. B. schon viele Normdatensätze für Politiker kleiner afrikanischer Länder. Aber ich denke halt, dass wir bei Personenkreisen, die zu 99,x Prozent keine Normdatensätze haben, nicht überall schon auf Vorrat eine Wartungskategorie reinsetzen müssen. Das verstopft nur die Kategorie und führt zu einem gewissen Frust bei den Leuten, die die Artikel in dieser Kategorie durchgehen um neue Normdatensätze einzutragen. Wenn wir dann mitbekommen, dass man inzwischen angefangen hat, GND-Datensätze für z. B. taiwanesische Badmintonspieler anzulegen, kann man ja immer noch z. B. per Bot überall in diese Artikel die entsprechenden Parameter setzen. --Kam Solusar (Diskussion) 15:43, 15. Mai 2012 (CEST)

Und konkret zur Ausgangsfrage von Andreas: Die Wartungslisten können sich danach richten, welche Vorlagen a) den Parameter "GNDName" enthalten (= potentieller Kandidat für Eintrag in die Fehlerliste: WP:PND/F) oder b) bereits in einer anderen Normdatei erfasst sind (= gute Chancen auf Übernahme in die GND). Langfristig könnte ich mir auch eine Wartungsliste "Wikipedia:Noch nicht auf GND geprüft"e Artikel vorstellen. (Da es nur einen Erfahrungswert, aber keine Ausschlusskriterien gibt, welche Personen einen Eintrag in der GND haben, muss man theoretisch alle abfragen. Was zeigt, dass der GNDfehlt-Hinweis auch in den Fällen hilfreich ist, in denen man nicht erwartet, dass die betreffende Person eine GND hat, denn dass ist ja nur eine Vermutung, die bestenfalls in 98% der Fälle zutrifft.) --Kolja21 (Diskussion) 00:00, 14. Mai 2012 (CEST)

Irgendwie gehen hier zwei Fälle heftigst durcheinander:

  1. Neuanlage von Normsätzen durch unsere Meldungen ist ein sehr seltener Fall und passiert derzeit nur indirekt, nämlich
    1. wenn dadurch ein von uns nachgewiesener Fehler in der Normdatei korrigiert werden kann
    2. oder wenn in der DNB vorhandene Literatur dadurch von einem Tn auf einen bislang noch nicht vorhandenen Tp umverknüpft werden kann (und da sitzt das wirkliche Problem mit den Millionen aus DNB-Sicht "leerer" Tn-Sätze mit 15er, 16er, 17er und 19er-Nummern: Dazu werden keine Meldungen akzeptiert).
  2. Allerdings gibt es durchaus nichtbibliothekarische Organisationen und Projekte, die Daten in die Normdateien einbringen, z.B. die erwähnten Literaturarchive, oder Projekte zu Professorenkatalogen und Digitalisierung von Nachschlagewerken. Es wurde bereits angedeutet, dass es durchaus denkbar wäre, "die Wikipedia" als Normdaten-Teilnehmer zuzulassen, das beträfe dann in der Masse die eher simpel gestrickten Fälle "Person nachweislich gar nicht in der GND und kann autonom eingetragen werden, sofern genügend bequellbare Daten zur Person vorliegen" -- Thomas Berger (Diskussion) 01:21, 14. Mai 2012 (CEST)

@Andreas: Ich finde deine Liste Parameterhäufigkeit in de:WP sehr nützlich, da man mit ihr Tippfehler wie "IVAF" (statt VIAF) und "PDF" (statt PND) finden kann. Was hält du daher von einer Wartungskategorie Kategorie:Wikipedia:Normdaten-Parameter falsch eingetragen? Und damit man auf einen Blick sieht, auf welcher Baustelle etwas zu tun ist, würde ich, falls keine Einwände kommen, die Oberkategorie Kategorie:Wikipedia:Normdaten anlegen. --Kolja21 (Diskussion) 05:24, 14. Mai 2012 (CEST)

Vorab: Das war nicht meine Liste, ich selbst kann so etwas auch nicht anlegen (und die Vorlage selber kann so etwas m. W. auch nicht erkennen). Ich wäre sehr für so eine Kategorie oder ein ähnliches Mittel. Praktikabler als eine Kategorie ist wohl eine immer mal wieder aktualisierte Liste solcher Artikel. Denn für so eine Kategorie müsste ja ein Bot die Kategorie einfügen, und dann ein Mensch die Fehler beseitigen. Das heißt: zwei Edits im Artikel. Eine Liste abarbeiten kann ein Mensch mit jeweils nur einem Edit im Artikel selbst. --AndreasPraefcke (Diskussion) 08:50, 14. Mai 2012 (CEST)

Die Liste "Normdaten-Parameter falsch eingetragen" müsste dann allerdings, wie die PND-Wartungslisten von APPER, die Artikel einzeln aufführen. Wer hat das technische Know-how? --Kolja21 (Diskussion) 14:59, 14. Mai 2012 (CEST)

Ich werte sowieso in unregelmässigen Abständen die PND-BEACON-Datei auf Dubletten und illegale Nummern aus und korrigiere dann die Artikel und ich kann auch in den etwa monatlichen Dumps "merkwürdige" Parameter ermitteln. Ich glaube nicht, dass da genug zusammenkommt, um das als "Wartungsliste" irgendwo hinzustellen (es schienen ein paar Dutzend Verschreiber in drei Jahren zustandegekommen zu sein?). Ich werde allerdings eine "Wartungsliste" zu den Artikeln erstellen, in denen GKD-V1 und GKD-V2 eingetragen ist, weil die ja als eigene Normdaten-Vorlage in vermutlich oft erst noch anzulegende Weiterleitungssätze aufgenommen werden sollen. Ich würde damit allerdings warten wollen, bis die Körperschaften-Zusammenführung in der GND abgeschlossen ist und dann kann auch evtl. der Bot, der die GKD- und SWD-Parameter in "GND" umwandelt, die Liste ausspucken. -- Thomas Berger (Diskussion) 15:23, 14. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:22, 7. Jul. 2012 (CEST)

Kurier

Ich habe jetzt einen Artikel im Wikipedia:Kurier zu den Neuerungen "publiziert". --AndreasPraefcke (Diskussion) 11:32, 16. Mai 2012 (CEST)

Ein gelungener Abschluss für die Arbeit (Phase 1: Einführung der GND). Wenn die Ausgabe des Kuriers nicht mehr aktuell ist, können wir die Grafik für den Artikel Gemeinsame Normdatei gut gebrauchen. Ich lade demnächst noch die Screenshots von Web NDL Authorities und VIAF hoch. --Kolja21 (Diskussion) 15:03, 16. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:22, 7. Jul. 2012 (CEST)

NDL-Api (2)

Ich brauche da nochmal Hilfe. SPARQL habe ich jetzt soweit verstanden, dass ich Abfragen konstruieren kann, die den Namen sowohl im eigentlichen Namensfeld, als auch in der Umschrift suchen (d. h. sowohl für Albert Einstein als auch für Yoshihiko Noda funktioniert). Inzwischen bin ich bei folgender Abfrage:

PREFIX rda: <http://RDVocab.info/ElementsGr2/>
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
PREFIX xl: <http://www.w3.org/2008/05/skos-xl#>
PREFIX ndl: <http://ndl.go.jp/dcndl/terms/>
SELECT ?uri1 ?name ?birth ?death WHERE {
?uri1 foaf:primaryTopic ?uri2 .
{?uri2 foaf:name ?name} UNION {?uri1 xl:prefLabel [ndl:transcription ?name;] . FILTER langMatches( lang(?name), "ja-Latn")} .
FILTER regex(?name, "Albert") #oder Yoshihiko
FILTER regex(?name, "Einstein") #oder Noda
OPTIONAL { ?uri2 rda:dateOfBirth ?birth. }
OPTIONAL { ?uri2 rda:dateOfDeath ?death. }
}

Das Problem ist, dass die elend langsam ist. Hat jemand eine Idee, wie das effizienter geht? --Schnark 10:28, 19. Mai 2012 (CEST)

Da du die Infos aus den Personendaten nimmst, wäre es da nicht performanter und vor allem treffsicherer die dort im Feld Alternativnamen hinterlegte japanische Schreibung zu verwenden? Die Transkription von uns und bei denen ist nicht immer identisch, z.B. bzgl. der Verwendung des Makrons als auch von der Person verwendete Spezialtranskriptionen, die so nicht in der NDL geführt werden. Unter Verwendung der japanischen Originalschreibung habe ich bisher aber stets Treffer bekommen. Das Format im Feld Alternativnamen ist auch immer dasselbe: eine beliebige Anzahl von Zeichen aus dem Unicodebereich [U+0020, U+3000 bis U+9FFF] und die zum Lemma passende Originalschreibung steht üblicherweise zuerst. Von daher sollte sich das leicht über ein Regex erfassen lassen, Whitespace (üblicherweise U+0020 und U+3000) entfernen und so der Abfrage übergeben lassen können. Dann braucht der NDL-Server auch nicht das kostenintensive UNION durchführen und evtl. könnten dann auch die SPARQL-Regexe entfallen. --Mps (Diskussion) 12:32, 19. Mai 2012 (CEST)
Kann bitte jemand, der sich mit der NDL auskennt, Alfons Mumm von Schwarzenstein seine NDL verlinken? Ein Werk ist als Digitalisat der Tōyō Bunko in seinem Artikel verlinkt, er müsste also eine eigene Nummer haben.--Kresspahl (Diskussion) 10:22, 18. Jun. 2012 (CEST)
Der scheint keine eigene Nummer zu haben. Das digitalisierte Werk ist zudem auch auf Deutsch und bis jetzt sind mir bei den NDL Authorities nur Autoren untergekommen die in Japan veröffentlicht wurden. --Mps、かみまみたDisk. 13:24, 18. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:22, 7. Jul. 2012 (CEST)

Hinweis zu Wikisource

Ich habe bei Wikisource die Anzeige der PND in den Personen- und ADB-Artikeln durch GND ersetzt (nicht jedoch den Parameternamen, das wäre dann doch ein bisschen zuviel des Guten, kann m. E. so bleiben). Und auch s:Vorlage:Ortsdaten sowie s:Vorlage:Textdaten, s:Vorlage:Themendaten und s:Vorlage:Verlag kennen jetzt Normdaten (Parameter GND). Die Ortsdaten werde ich großflächig eintragen, sobald die DNB sich der Dubletten in diesem Bereich entledigt hat. Wer sonst noch in anderen Schwesterprojekten unterwegs ist, kann sich ja vielleicht auch einmal Gedanken machen, was da geändert werden muss und das in die Wege leiten. --AndreasPraefcke (Diskussion) 09:14, 21. Mai 2012 (CEST)

Gute Idee. An Wikisource hatte ich noch gar nicht gedacht. Du kennst die Übersicht schon, aber für andere, die hier vielleicht mitlesen, eine Übersicht über die von der GND betroffenen Vorlagen findet sich unter Hilfe:GND#Vorlagen. (Ich habe versucht, alle Interwikilinks zu erfassen; häufig wurden die Vorlagen ohne Dokumentation und ohne Link auf die Ursprungsfassung in andere Sprachversionen reinkopiert.) Da gibt es noch Einiges abzuarbeiten. --Kolja21 (Diskussion) 01:42, 22. Mai 2012 (CEST)
Jetzt übrigens auch s:BLKÖ, und Apper hat dankenswerterweise auch schon eine automatische BEACON-Datei dazu eingerichtet. --AndreasPraefcke (Diskussion) 00:09, 27. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:22, 7. Jul. 2012 (CEST)

Stand Auflösung der Vorlage:PND

Derzeit ist die Vorlage:PND noch in 1272 Artikel eingebunden (CatScan V2.0β: [15]), dabei sind alle in der Kategorie:Mann und es gibt weder die Normdaten- noch die PND-Vorlage und alle Vorlagennutzungen sind in der Form mit nur einem Parameter, also {{PND|123456789}}, allerdings gibt es ein paar Artikel mit mehreren PND-Einbindungen oder mit zusätzlichen HTML-Kommentaren.

Bei manueller Abarbeitung (der mehrparametrigen Einbindungen) gestern hat es sich für mich am günstigsten herausgestellt, die Normdaten-Vorlage "frisch" auszufüllen, dabei die PND-Vorlage heranzuziehen, wenn ich nichts fand, und anschließend die PND-Vorlage in DNB-Portal umzuwandeln oder zu löschen (allerdings steht bei diesen älteren Sätzen die Vorlageneinbindung nicht immer bei == Weblinks ==). Das ist aber ein recht zeitaufwendiges Verfahren, weil dabei auch einige Meldungen unter WP:PND/F anfallen. Eine Umwandlung ausgehend von der derzeitgen Nutzung müsste aber wenigstens ermitteln, ob es auch wirklich ein individualisierter Satz ist, der da eingetragen ist und ob es unter der Nummer auch wirklich (noch) Treffer im DNB-Portal gibt.

Es gibt allerdings eine ähnlich große Anzahl (723) von Personenartikeln mit Vorlage:DNB-Portal ohne Vorlage:Normdaten, die eigentlich denselben Wartungsbedarf wie die verbliebenen Vorlage:PND-Fälle haben (zumindest wenn nicht auch noch die Vorlage:PNDfehlt belegt ist und darauf hindeutet, dass es sich um einen Tn-Satz handelt). Ein Bot könnte daher auch jetzt die triviale Umsetzung Vorlage:PND -> Vorlage:DNB-Portal veranstalten und die Normdaten werden irgendwann ergänzt. -- Thomas Berger (Diskussion) 09:16, 22. Mai 2012 (CEST)

Hallo Thomas, wieso nennt "Jarry1250's Toolserver Tools" 400 Treffer mehr? ("1657 Vorlageneinbindungen wurden ermittelt".) Jede gut geplante Bot-Unterstützung ist mir recht. Wir haben ja auch noch die 16.500 Mal eingebundene Vorlage:PNDfehlt. Genug Arbeit für mehr als ein Jahr. Gruß --Kolja21 (Diskussion) 19:03, 22. Mai 2012 (CEST)
Die 400 zusätzlichen Treffer sind in Diskussionen und im Benutzernamensraum. --AndreasPraefcke (Diskussion) 08:18, 23. Mai 2012 (CEST)
Ja, ein Bot könnte jetzt (nach der umfangreichen Abarbeitung aller komplizierteren Fälle) die triviale Umsetzung -> DNB-Portal (im Artikelnamensraum) jetzt machen, dann könnten wir die Vorlage endlich löschen. Die dann ca. 2000 Artikel mit DNB-Portal ohne Normdaten-Vorlage müssten wir allerdings so oder so verstärkt in Angriff nehmen, da ist der Bot-Edit jetzt nicht so die große Hilfe "zur Verbesserung unserer Enzyklopädie". Über CatScan komme ich übrigens nicht an "alle mit DNB-Portal und ohne Normdaten" heran, scheint ihn zu überfordern (hängt sich auf), da wäre eine numerierte Liste eine willkommene Arbeitshilfe (am besten mit 50er-Abschnitten, die sich Mitarbeiter reservieren können und dann abhaken). --AndreasPraefcke (Diskussion) 10:01, 23. Mai 2012 (CEST)
Klarer Fall für Benutzer:APPER/Wartungslisten ;) --Kolja21 (Diskussion) 13:07, 23. Mai 2012 (CEST)

Ich habe den Toolserver überlistet oder die Tageszeit war günstig, jedenfalls sind die Seiten (zu DNB-Portal und PND) nun einmal zusammengefasst als portionierte Liste Benutzer:Gymel/NDmiss abgespeichert. Da das Abarbeiten gewiss länger dauert, darf der Botlauf durchaus stattfinden, sofern er stur PND in DNB-Portal abändert, bleibt diese Liste gleich gültig. -- Thomas Berger (Diskussion) 15:53, 23. Mai 2012 (CEST)

Danke für die Liste. Kann der Bot eventuell auch fremdsprachliche Versionen der Wikipedia mit einbeziehen? Dort ist die Arbeit sogar noch wichtiger, da die Vorlagen oft nicht dokumentiert sind. Wenn demnächst der Link zu der deutschsprachigen Vorlage gelöscht wird, weiß man also nicht mehr, wozu sie überhaupt angelegt wurden. --Kolja21 (Diskussion) 13:52, 24. Mai 2012 (CEST)

Ich habe die verbliebenen PND-Einbindungen im Artikelnamensraum jetzt alle durch DNB-Portal ersetzt. Meinetwegen kann man Vorlage:PND löschen, oder noch eine Weile stehen lassen. --AndreasPraefcke (Diskussion) 20:44, 25. Mai 2012 (CEST)

Wow, das ging schnell. Danke! Deinen Hinweistext finde ich hilfreich. Da die Vorlage über 500 Mal auf Benutzer- und Diskussionsseiten verlinkt ist und auch noch zahlreiche Interwikilinks abgearbeitet werden müssen, finde ich es gut, wenn sie vorerst in der vorliegenden Fassung erhalten bleibt. Gruß --Kolja21 (Diskussion) 22:48, 25. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:23, 7. Jul. 2012 (CEST)

Einbinden "roter" Kategorien

Bin mir grad unsicher, auf welcher Diskussionsseite ich das posten soll, aber ich nehme an, hier ist's passend und das hat sowieso jeder auf dem Schirm. Ich habe in Christoph Hartung von Hartungen (Arzt, 1849) mit Schnarks Skript die "neue" Vorlage gesetzt und seither wird die noch rote Kategorie:Wikipedia:GND fehlt 2011-12 eingebunden. Soll das wirklich so? Und ist der Zeitraum "2011-12" sinnvoll gewählt? --Mai-Sachme (Diskussion) 20:35, 23. Mai 2012 (CEST)

Das "12" meint Dezember: Das Skript hat das Prüfdatum "22. Dezember 2011" aus der PNDfehlt-Vorlage genommen und in den Parameter GNDCheck=2011-12-22 der Normdaten-Vorlage umgewandelt, da es nicht entscheiden mag, ob Du bei Deinem Edit die Situation in der GND erneut übeprüft hast. Das vom Skript eingeblendete Menue hat unten einen Link "Datum aktualisieren", der müsste angeklickt werden, um eine erneute Prüfung zu dokumentieren. Ich vergesse das auch immer, evtl. wäre ein aktiv zu setzendes Häkchen in räumlicher Nähe zum Eingabefeld für GNDName eine bessere Variante? -- Thomas Berger (Diskussion) 21:32, 23. Mai 2012 (CEST)
Ah danke, das hatte ich übersehen. Primär hatte ich mich allerdings für die eingeblendete Wartungskategorie interessiert, die nun nach der Aktualisierung verschwunden ist. --Mai-Sachme (Diskussion) 21:54, 23. Mai 2012 (CEST)
Wg. GNDCheck=2012-05-23 ist er per Vorlagen-Funktionalität jetzt bei GND fehlt 2012-05 gelistet (ich weiss gar nicht, ob man die Vorlage so programmieren könnte, dass nur bereits angelegte Wartungskategorien beschickt werden, ich hielte das aber auch gar nicht für sinnvoll). Dass da nach etwas über einer Woche schon 2.000 Artikel auf Wartung warten, ist hoffentlich nur ein Ausreisser für diesen speziellen Umstellungsmonat: GNDCheck entspricht ja in etwa der alten Vorlage:PNDfehlt, und die hatte es in etwa auf 2.000 Belegungen pro Jahr gebracht... -- Thomas Berger (Diskussion) 22:10, 23. Mai 2012 (CEST)
Das ist kein Ausreißer. Unter "GND fehlt" werden zzt. sogar Artikel mit individualisierter GND erfasst, wenn eine Dublette vermerkt ist. Ich denke, man sollte eine Kat "GND Wartung" schaffen und diese dann entsprechend untergliedern. Vorschläge dazu unter Kategorie Diskussion:Wikipedia:GND fehlt. Gruß --Kolja21 (Diskussion) 01:55, 24. Mai 2012 (CEST)
Inzwischen kann mein Skript das Datum auf Wunsch aktualisieren, dazu befindet sich ein Link in der Fußzeile.
Es ist auch möglich, die Vorlage so zu programmieren, dass sie auf das Vorhandensein der Kategorie achtet, ich habe das mal in Vorlage:NormdatenTemp eingebaut, bei Bedarf kann das in die richtige Vorlage übernommen, ansonsten revertiert werden. Falls die Kategorie fehlt, wird stattdessen eine Ersatzkategorie (die man noch anlegen müsste) befüllt. --Schnark 09:31, 24. Mai 2012 (CEST)
Kl. Anm.: Warum benutzt du nicht den Link "Test-/Beispielseite erstellen"? Dann erreicht man mehr Leser/Tester. Gruß --Kolja21 (Diskussion) 13:48, 24. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:23, 7. Jul. 2012 (CEST)

GND zu einer Körperschaft

Hola, 2 Fragen:

  • Gibt es bei Körperschafts-GNDs auch die Unterscheidung individualisiert vs. nicht individualisiert?
  • Lohnt sich eine Bitte um Ausbau auf WP:PND/F?

Anlass ist die GND zum Slowenischen Alpenverein. --Mai-Sachme (Diskussion) 22:40, 4. Jun. 2012 (CEST)

Da gibt es auf VIAF leider kein undifferentiated, wie das bei nicht individualisierten Personen der Fall ist.--84.161.210.139 22:46, 4. Jun. 2012 (CEST)
"Slowenischer Alpenverein" etwa ist nicht als Generikum gemeint, Körperschaften sind immer sie selbst und keine andere. 1995 gab es eine deutschsprachige Publikation "Berghütten des slowenischen Alpenvereins" [16], dadurch ist "Slowenischer Alpenverein" als eine quasi offizielle Eigenbezeichung der Körperschaft belegt und normsatzfähig. Falls (sobald?) wir einmal erlaubt bekommen, auf WP:PND/F auch Meldungen zu Körperschaften zu machen, wird es analog den Personen klare Hinweise dazu geben, welche Informationen passen werden. Ich könnte mir vorstellen, dass Hinweise auf Sitz, Gründungsjahr und Namen von Vorgängerkörperschaften erwünscht sein könnten. Im konkreten Fall gibt der Wikipedia-Artikel aber gerade dazu nichts her... -- Thomas Berger (Diskussion) 23:09, 4. Jun. 2012 (CEST)
Naja es gibt durchaus auch unterschiedliche Körperschaften mit demselben Namen (mal als Beispiel Andreas-Hofer-Bund), insofern ist die Situation analog zu Personennamen, daher hatte ich gedacht, dass die DNB da auch unterscheidet, aber wenn nicht, dann stört's mich auch nicht :-) --Mai-Sachme (Diskussion) 23:21, 4. Jun. 2012 (CEST)
Doch, sie unterscheidet da (theoretisch) immer. Zu den drei Andreas-Hofer-Bünden gibt es allerdings nur zwei Normsätze, obwohl die DNB immerhin drei Publikationen des (einen Normsatz vermissenden) Andreas-Hofer-Bund Tirol aus den 1930er Jahren nachweist: Aus unserer Sicht wäre das meldewürdig, dürfte aber mit den bekannten Hinweisen "keine nachträgliche Verschlagwortung" und "keine nachträgliche Verknüpfung" (es gibt jeweils persönliche Verfasser, also nach den bibliothekarischen Regeln keinen Grund, die komplizierte Ansetzung der Körperschaft vorzunehmen) abgeschmettert werden. -- Thomas Berger (Diskussion) 23:47, 4. Jun. 2012 (CEST)
Zusammengefasst zwei Antworten: Nein, es gibt keine nicht individualisierten Körperschafts-GNDs, und ja, auf jeden Fall wollen wir in Zukunft alle Fehler und Verbesserungsvorschläge (nicht nur bei Personen) an die GND-Redaktion melden. Gruß --Kolja21 (Diskussion) 00:36, 5. Jun. 2012 (CEST)
Danke für eure Hinweise! --Mai-Sachme (Diskussion) 13:41, 5. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:24, 7. Jul. 2012 (CEST)

Format des LCCN-Parameters

Ein kurzer Hinweise auf Vorlage_Diskussion:LCCN, wo ich eine meines Erachtens notwendige Diskussion über das Format des LCCN-Parameters anstoßen möchte. --Monsieur Becker (Diskussion) 07:50, 8. Jun. 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:24, 7. Jul. 2012 (CEST)

Computerspiele

sind in der GND unter "Softwareprodukt (siw)", also unter "Sachbegriff" einsortiert. Gehörte das nicht vielmehr zu den "Werken"? (ich wüsste nicht, was einem Computerspiel weniger Werk sein sollte als an einem Roman oder einem Kinofilm). Beispiel: http://d-nb.info/gnd/4311276-6 Bei uns also "TYP=s" oder "TYP=w"? --AndreasPraefcke (Diskussion) 14:25, 14. Jun. 2012 (CEST)

Ich kann der Auffassung, dass Softwareprodukte vielmehr Werke als Sachbegriffe sind, an sich nur zustimmen. Andererseits fühle ich mich aber dem Prinzip der Normdatei verpflichtet und fände es uneinheitlich, wenn wir in der Entitätencodierung abwichen. Somit bin ich für "TYP=s". --Monsieur Becker (Diskussion) 18:46, 14. Jun. 2012 (CEST)
Ist mir auch schon mehrfach aufgefallen und ich hab mich über diese Kategorisierung gewundert. Aber Computerspiele scheinen eh bislang eher stiefkindlich behandelt zu werden. Über portal.dnb.de finden sich zwar Lösungsbücher, Romane oder Soundtracks zu Spielen, aber die Spiele selbst scheinen nicht aufgenommen zu werden. --Kam Solusar (Diskussion) 23:24, 14. Jun. 2012 (CEST)

Typ "siw" gehört zu TYP s. Für was "s" genau steht, kann man immer noch präzisieren, z.B. "Sachbegriffe, einschl. Computerspiele". --Kolja21 (Diskussion) 23:35, 14. Jun. 2012 (CEST)

Nur wäre eine Einordnung als Werk ("w") IMO irgendwie logischer und konsequenter. --Kam Solusar (Diskussion) 11:47, 16. Jun. 2012 (CEST)
Auch nicht elektronisches wie "Monopoly" ist in der GND vom Typ "Marke, Produkt". Bei einem elektronischen Spiel gibt es auch noch die Software, die klar unter das Urheberrecht fällt. Aber es geht natürlich eher um das Spiel an sich, die Spielidee, die Optik etc. und da tut sich auch das Urheberrecht schwer, selbst bei "Autorenspielen". Der Werkbegriff der Bibliotheken ist m.E. nah an dem des Urheberrechts, während wir hier einen deutlich weiteren Werkbegriff haben, der auch (zuschreibbare) Ideen oder Ingenieurleistungen umfasst. -- Thomas Berger (Diskussion) 13:22, 16. Jun. 2012 (CEST)
Ein Computerspiel von heute hat von Aufwand und Machart mehr mit einem Hollywoodfilm zu tun als mit irgendetwas anderem. Wir reden hier ja nicht von Pong. Daher finde ich das "s" ziemlich falsch und auf dem Stand der 70er Jahre (wie so vieles im Bibliothekswesen...). --AndreasPraefcke (Diskussion) 19:07, 16. Jun. 2012 (CEST)

Auch lustig: http://d-nb.info/gnd/4040037-2 Typ zwar "gik" (also g wie Geografikum), aber Extraterrestrika als "Geo"grafikum zu bezeichnen, ging irgendjemand gegen den Strich, also steht statt "Geografikum" doch wieder "Sachbegriff" in der Tabelle... Bei "Sonne" dito. Die Planeten wiederum sind "Geografika"... --AndreasPraefcke (Diskussion) 20:38, 16. Jun. 2012 (CEST)

Mit den "Typen" werden wir noch viel Freude haben... http://d-nb.info/gnd/4003385-5 --AndreasPraefcke (Diskussion) 21:19, 16. Jun. 2012 (CEST)

Die Ansetzung steht im MARC-authority-Feld 150 für Sachbegriffe, daher das Label "Sachbegriff" und der Satz ist (079$b) vom Typ Ts. Gezeigt wird aber der Entitätencode (079$v) und der beginnt halt mit "g". Keine Ahnung, ob eine solche Schere im Plan ist oder ob da einfach zwei separate Umsetzungsalgorithmen versehentlich zu verschiedenen Schlüssen gekommen sind. "Lustig" ist eher, dass für diese Sätze im GND-Portal kein Kontaktformular angeboten wird... -- Thomas Berger (Diskussion) 21:21, 16. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:24, 7. Jul. 2012 (CEST)

Botanfrage zur Auflösung der Vorlage:PNDfehlt

habe ich soeben hier gestellt. -- Thomas Berger (Diskussion) 09:56, 15. Jun. 2012 (CEST)

*Räusper*, dann werden in ein paar 1000 Artikel rote Kategorien eingebunden. --Mai-Sachme (Diskussion) 10:17, 15. Jun. 2012 (CEST)
Das ist sozusagen der Hauptgrund für die Eile: Beim Umarbeiten entstehen derzeit einzelne, die zugehörige Kategorie lässt sich schnell einrichten (enthält nur einen stereotypen Baustein {{GND fehlt}}), während der paar Stunden, wo der Artikel in Spezial:Gewünschte_Kategorien gelistet ist, wird er noch einmal entdeckt und das Datum angepasst, so dass die Kategorie dann leer ist: Mindestens eine ist bereits wieder als "Kategorie ohne Inhalt" gelöscht worden... Wenn die PNDfehlt-Daten aber überführt sind, wird nichts mehr an historischen Zeitstempeln hinzukommen, wenn dann eine der Wartungskategorien leer wird, bleibt sie es auch. -- Thomas Berger (Diskussion) 11:00, 15. Jun. 2012 (CEST)
... und kann dann, wenn alle Artikel abgearbeitet sind, wieder gelöscht werden, oder? Ein Liste der verschiedenen (Ab-)Arbeitsfelder bietet jetzt die (von Andreas angelegte) Kategorie:Wikipedia:Normdaten-Wartung. Danke für die akribisch formulierte Bot-Anfrage! Nur einen Verbesserungsvorschlag: Ich ziehe es vor, die vollständige Vorlage
{{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=}} bzw.
{{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=|GNDName=|GNDfehlt=ja|GNDCheck={{subst:NormdatenDatum}}|REMARK=}}
in die Artikel einzubauen. Wenn die leeren Parameter mit angegeben sind, muss niemand umständlich lernen bzw. nachschlagen, welche Parameter für die Vorlage infrage kommen. Diese Vorgehensweise hat sich bei den Infoboxen bewährt. Gruß --Kolja21 (Diskussion) 15:17, 15. Jun. 2012 (CEST)
Naja, aber "GNDName" wird typischerweise irgendwann durch Wegnehmen von vier Zeichen in "GND" umgewandelt, das wäre dann doof, wenn da bereits ein leeres "GND=" herumgammelt. Und bis jemand LCCN, NDL oder VIAF ausfüllen will, ist evtl. noch ein Parameter theoretisch erlaubt worden und der hat dann Schwierigkeiten wahrgenommen zu werden, weil er nicht "vorbereitet" ist. Es sind zugegebenermaßen nur stilistische Unterschiede zwischen Infoboxen und allgemeinen Vorlagen, aber irgendwie reflektieren die doch die jeweilige Dynamik. -- Thomas Berger (Diskussion) 16:40, 15. Jun. 2012 (CEST)
:-) und noch ein Hinweis zu den leeren Datenfeldern. Ich nutze die von Benutzer:PerfektesChaos zur Verfügung gestellte Benutzer:PerfektesChaos/js/WikisyntaxTextMod. Dabei ist mir aufgefallen, dass genau diese leeren Datenfelder "weggeputzt" werden. Wenn diese Datenfelder also erwünscht sind, dann sollte PerfektesChaos davon in Kenntniss gesetzt werden? Liebe Grüße und Dank an alle, die sich sooooo sehr für die Normdaten einsetzen. Silke (Diskussion) 16:50, 15. Jun. 2012 (CEST)
Entschuldige Kolja21, da hatte ich das falsche Skript in Verdacht. WikisyntaxTextMod ist für das "Putzen" nicht verantwortlich. "Geputzt" wird aber bei mir, da bin ich ganz sicher. Nachdem ich nun ein paar Dinge ausprobiert habe, weiß ich, dass das Normdatenskript von Benutzer:Schnark dafür verantwortlich ist. Da Schnark hier mitliest, wird er sich sicher (hoffentlich) dazu melden. Einen schönen Abend noch und Grüße --Silke (Diskussion) 20:23, 15. Jun. 2012 (CEST)
Danke für den Hinweis, das Skript kannte ich noch nicht. Ich halte die standardisierte Reihenfolge gerade auch im Hinblick auf eine Umwandlung von "GNDName" in "GND" für wichtig, denn die Reihenfolge der Parameter entscheidet mit darüber, ob ich den Sinn einer Vorlage auf Anhieb verstehe. Für den Techniker mag es schnuppe sein, ob da "GND, LCCN und NDL" oder "LCCN, NDL und GND" steht, aber nicht wenige Autoren kommen aus anderen Gebieten und "denken" nicht wie ein Computer. Im Grunde ist es wie bei der Sprache, der Sinn von Wörtern erschließt sich (für den menschlichen Leser) durch die Reihenfolge. --Kolja21 (Diskussion) 19:50, 15. Jun. 2012 (CEST)
Als kleiner Hinweis: Mein Skript besitzt eine (undokumentierte) Konfigurationsvariable, um das Entfernen leerer Felder zu unterlassen, allerdings sehe ich das so wie Gymel und halte diese ganzen leeren Parameter für nicht wirklich hilfreich/nötig. Ein Benutzer, der nichts von einem Parameter LCCN weiß, der weiß auch nicht, wie er die LCCN herausfindet, geschweige denn, wie er sie formatieren muss. --Schnark 09:27, 16. Jun. 2012 (CEST)

Die vollständige Vorlage auch bei leeren Werten finde ich gar nicht so doll. Die automatische Syntaxkosmetik löscht sie z. B. gleich wieder... (hab mich getäuscht, es ist das Normdatenscript) Und überhaupt: wer Normdaten in größerem Ausmaß einbauen will, sollte unbedingt das Schnark-Script verwenden, alles andere ist doch nur völlig unnötige Arbeitsbelastung. Und das Eintragen von Normdaten durch "Laien" (also die, die das nur zwei, drei mal im Monat machen werden) ist ohnehin fehlerbehaftet. Es "fehlt" ja nicht unbedingt etwas, wenn nioht alle Felder ausgefüllt sind. --AndreasPraefcke (Diskussion) 19:05, 16. Jun. 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:25, 7. Jul. 2012 (CEST)

Noch eine Wartungskategorie

Bei eigentlich jedem Eintrag ist über die reine Umsetzung in die neue Vorlage hinaus noch VIAF nachzutragen oder auch manchmal schon eine individualisierte PND, oder der Namenseintrag mitsamt VIAF bei nur unpassenden Werken ganz raus. Je schneller wir sind, desto schneller kann sie gelöscht werden... Kategorie:Wikipedia:Artikel mit Vorlage PNDfehlt und PND-Namenseintrag Übrig bleiben dann nur noch PNDfehlt-Einträge mit Datum 2011 oder 2012 und ohne PND-Namens-Nummer. --AndreasPraefcke (Diskussion) 19:02, 5. Jul. 2012 (CEST)

Danke, habe die neue Kat schon entdeckt. Die Einbindung der veralteten PNDfehlt-Vorlage hat sich seit der Botanfrage von 16.000 auf rund 8.500 Artikel bereits fast halbiert. Offenbar geht es auch ohne Bot :D --Kolja21 (Diskussion) 21:55, 5. Jul. 2012 (CEST)

Ist schon wieder weg, da abgearbeitet. Es bleiben jetzt nur noch ganz einfache Einbindungen {{PNDfehlt|Datum}}, und auch die nur von 2011 und 2012. Bot-Anfrage wurde von mir nochmals vereinfacht. --AndreasPraefcke (Diskussion) 17:39, 6. Jul. 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: AndreasPraefcke (Diskussion) 10:25, 7. Jul. 2012 (CEST)

Wikipedia-Link der DNB

Früher, in der guten alten Zeit, gab es vom Datensatz der DNB einen Link zum entsprechenden WP-Artikel (soweit wir die Normdaten entsprechend eingetragen hatten). Dies scheint nicht mehr der Fall zu sein. Weiß jemand wieso?Olaf2 (Diskussion) 14:52, 30. Jul. 2012 (CEST)

Mal funktioniert's, mal wieder nicht... Ende Juli sollte es jetzt bald wieder funktioneren, siehe Benutzer_Diskussion:APPER#links_in_der_DNB_auf_die_WP --FA2010 (Diskussion) 14:56, 30. Jul. 2012 (CEST)
Danke.Olaf2 (Diskussion) 15:51, 30. Jul. 2012 (CEST)

Scheint mittlerweile wieder zuverlässig zu funktionieren. Sehr schön. Ich geh mal davon aus, dass ich nicht einfach nur Glück hatte, wenn ich in den letzten 14 Tagen geschaut hab und erle. -- Make (Diskussion) 15:10, 16. Aug. 2012 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: Make (Diskussion) 15:12, 16. Aug. 2012 (CEST)

Programmierer gesucht

Hallo. Wie schon öfter erwähnt, wird die GND ab Juli wohl unter freier Lizenz verfügbar sein. Dass es sich lohnt, diese in irgendeiner Form auf dem Toolserver zur Verfügung zu haben, liegt auf der Hand. Mein Account hat inzwischen soviele Datenbanken, dass ich öfter an die 15-Verbindungen-Grenze komme... da ich auch nicht dauerhaft alles alleine machen will, stelle ich mal die Frage in den Raum, ob es hier jemanden gibt, der Programmiererfahrung hat und mit mir gemeinsam eine so genanntes Multi-Maintainer-Project (MMP) auf dem Toolserver erstellen will. Innerhalb dieses Toolserver-Accounts kann dann alles ablaufen, was Normdaten betrifft. Neue Sachen wie die GND-Datenbank aber über kurz oder lang auch das Normdaten-Bezogene, was bisher auf meinem Account läuft (also z.B. die Extraktion der Normdaten aus der Wikipedia und Redirects etc.). Also: gibt es interessierte Programmierer (idealerweise schon mit Toolserver-Erfahrung/-Account)? Grüße --APPER\☺☹ 19:19, 10. Mai 2012 (CEST)

Klärungsbedarf mit der DNB?

Ich habe jetzt nicht jeden Diskussionsbeitrag durchgelesen, irgendwo tauchte aber mal mein Name auf mit der Bitte um Rückfrage bei der DNB auf. Könntet ihr hier bitte mal kurz notieren, was zu klären ist?

Konkret ist mir gerade eben ein GND/kiz-Duplikat aufgefallen: 4707542-9 und 2101563-6 zum NS-Dokumentationszentrum der Stadt Köln. — Raymond Disk. 12:03, 12. Mai 2012 (CEST)

Hi Raymond, die Frage ist, ob wir die Liste Wikipedia:PND/Fehlermeldung zu "WP:GND/Fehlermeldung" erweitern können. Gibt es innerhalb der GND-Redaktion noch eine Trennung, wer Personen bzw. Geografika etc. bearbeitet? Außerdem könnte man die Umstellung auf die GND dazu nutzen, freundlich anzufragen, ob die Abarbeitung der gemeldeten Fehler nicht schneller möglich ist. Per E-Mail dauert das in der Regel nur einen Tag; unsere Liste dagegen hat mittlerweile eine Wartezeit von einem halben Jahr, was für beide Seiten auf die Dauer frustrierend ist. --Kolja21 (Diskussion) 16:04, 12. Mai 2012 (CEST)
Bei mir ist immer noch die Frage offen, was mit Einträgen wie dem GND 174188625 passieren soll. So ein Eintrag ist zu dünn: Name und Geburtsjahr reicht einfach nicht, um davon ausgehen zu können, dass es die gleiche Person ist. So würde ich den Beitrag niemals Lothar Brandes zuordnen, obwohl es natürlich sein kann. Ich glaube, du hattest da schonmal angefragt... --APPER\☺☹ 23:48, 12. Mai 2012 (CEST)

@APPER: Da legst du die Latte aber sehr hoch ;) Traditionell reicht für Bibliotheken das Geburtsjahr als Indikator aus. In den seltenen Fällen, dass zwei Autoren den gleichen Namen und das gleiche Geburtsjahr haben, ergänzt die LoC noch Tag und Monat der Geburt. Mehr war ursprünglich, in Zeiten des Zettelkatalogs, nicht vorgesehen. (Nicht mal das Todesjahr wurde nachträglich ergänzt, weil sich damit die Ansetzung geändert hätte.) Konkret heißt das: Der von dir erwähnte Fall sollte natürlich auf der PND/F-Seite eingetragen werden, nur wie prüft die GND-Redaktion die Zugehörigkeit? D.h. ich wüsste gerne von der DNB, welches Wissen sie nutzt, das der DNB-OPAC nicht anzeigt. Z.B.: Wer hat den Datensatz geliefert (PICA3-Feld 012 Nutzungskennzeichen) und vor allem, mit welchen Büchern, Schriftstücken etc. ist er verlinkt? Können wir mit dem nötigen Know-how selbst überprüfen, ob die Person unser "Lothar Brandes" ist oder müssen wir die Fehlermeldung blind abgegeben, in dem Sinne: Überprüft mal, ob das die gleiche Person ist, auf die sich euer Tp bezieht. --Kolja21 (Diskussion) 23:22, 13. Mai 2012 (CEST)

Ein tagesgenaues Geburtsdatum reicht mir ja schon - oder halt Geburts- und Sterbejahr. Oder eine Jobbezeichnung... Bei den 17***er PND-Nummern sind leider Dutzende solche Einträge dabei (also auf die ich schon gestoßen bin - also mit Wikipedia-Eintrag). Bisher habe ich die nicht gemeldet - weil ich halt nicht weiß, ob die DNB da überhaupt was machen kann. --APPER\☺☹ 00:00, 14. Mai 2012 (CEST)
VIAF nimmt deutlich die Literatur, die mit so einem Normsatz geliefert wird, als Informationsquelle für seine Bedeutung. In der PND scheint es ähnlich zu sein, der "Verursacher" eines Normsatzes (von ihm wird angenommen, dass er ihn mindestens einmal nutzt oder zumindest genutzt hat) wird in Prozesse zur Identitätsklärung oder Dublettenbereinigung eingebunden und muss sich äußern, welche Person bei der Anlage des Normsatzes wirklich gemeint gewesen ist. Speziell bei den 17er und 18er-Nummern, insgesamt bei den etwa 3.000.000 offline eingespielten Sätzen vom letzten Jahr (nur ein kleiner Teil davon Tp) ist bekannt, dass die DNB überhaupt nichts anderes darüber weiss als im Normsatz steht, also immer eine Fremdredaktion befragt werden muss. Um die nicht übermässig zu belasten wurde in PND-Redaktionskreisen die Devise ausgegeben, von Meldungen bezüglich Dubletten möglichst Abstand zu nehmen. An der Stelle ist die Wikipedia aber deutlich Nutzer der Normdaten, und ich z.B. finde nicht, dass wir von solchen Meldungen Abstand nehmen sollten: Bei den SWD- und GKD-Körperschaften z.B. ist angekündigt, dass maschinelle Abgleichsläufe sehr bald stattfinden sollen, für die Personen hingegen ist m.W. konkret nichts geplant, d.h. es kann nur über hartnäckiges Melden eine Verbesserung geben. -- Thomas Berger (Diskussion) 00:14, 14. Mai 2012 (CEST)
Bislang hat die DNB solche Anfragen abgelehnt, da, wie Thomas eben schon geschrieben hat, die Masse von Neueinspielungen erst halbautomatisch nach Dubletten durchsucht werden soll. (Tagesgenaue Geburtsdaten gibt es übrigens aus Datenschutzgründen eher selten; in der Regel wird der Beruf als zweiter Indikator hinzugefügt.) Drei, vier Monate würde ich der DNB mindestens Zeit lassen, bevor wir alle 17er- und 18er-Nummern melden. Drängen würde ich dagegen auf den Abbau der alten Listen. (Es muss doch möglich sein, mal ein, zwei studentische Hilfskräfte zu finanzieren. Warum z.B. nicht aus dem Kreis der Wikipedianer?) --Kolja21 (Diskussion) 00:21, 14. Mai 2012 (CEST)
Die Einspielungen erfolgten im April und Oktober 2011 (letztere wurden allerdings erst Anfang Dezember 2011 in der PND sichtbar). Dabei wurden Tn-Sätze stark maschinell abgeglichen, Tp-Sätze vorsichtshalber überhaupt nicht. Ich kenne keine Quelle dafür, dass ein maschineller Abgleich der Tp-Sätze geplant sein könnte und unterstelle, dass die Zurückhaltung beim gegenseitigen Melden nur aus Rücksichtnahme auf die Bearbeitungskapazitäten bei den Nicht-DNB-Redaktionen motiviert ist. -- Thomas Berger (Diskussion) 01:06, 14. Mai 2012 (CEST)

PICA-Link

Momentan ist der beim Parameter PND vorhanden, aber beim Parameter GND nicht. Als Begründung, den wegzulassen, konnte ich hier nur finden, dass bei http://dispatch.opac.d-nb.de oben drüber „Dieser Katalog wird nicht mehr weiterentwickelt.“ steht, aber das ist ja offenbar ein rein ästhetisches Problem; die Datensätze dort sind aktuell wie eh und je. Könnte man also den Link (oder einen äquivalenten, der direkt zu den Rohdaten führt) bitte auch bei GND wieder einbauen? PDD 16:49, 16. Mai 2012 (CEST)

War m.E. eigentlich auch so beabsichtigt, zumindest aber auch von APPER so gewünscht worden. Könnte bei der Gelegenheit das kryptische "PICA" auf "Rohdaten" abgeändert werden, oder ist das zu raumgreifend breit? -- Thomas Berger (Diskussion) 18:30, 16. Mai 2012 (CEST)
Es wird ohnehin nur für die angezeigt, die Metadaten angeschaltet haben. Da ist das raumgreifende eigentlich egal. --AndreasPraefcke (Diskussion) 21:19, 16. Mai 2012 (CEST)
Hallo PDD, wenn ich die von dir verlinkte Seite anklicke, erhalte ich die fett und in rot gedruckte Meldung: "Diese Variante des DMA-Kataloges steht nicht mehr zur Verfügung. Für die Recherche in den Beständen und Normdaten des Deutschen Musikarchivs nutzen Sie bitte das Web-Portal der Deutschen Nationalbibliothek". Dieses "rein ästhetische" ;) Problem führte unter anderem dazu, dass die mittlerweile gelöschte "Vorlage:DM" nicht mehr funktioniert hat, da der alte OPAC Probleme mit den Redirects hat. Auch bei Datensätzen, mit denen keine Literatur verknüpft ist, erhalte ich öfters Fehlermeldungen. Ich finde, man sollte weder zu dem veralteten OPAC, den die DNB ja "vom Netz" nehmen will, verlinken, noch einen Sammelbegriff wie "Rohdaten" zu verwenden, da es die unterschiedlichsten Formate wie PICA+, PICA3 und MARC gibt. Wer entsprechende Daten sucht, wird auf die bekannte Weise (Klick unter das Personenicon) im OGND fündig. Gruß --Kolja21 (Diskussion) 22:56, 16. Mai 2012 (CEST)
Aha, dann suche ich also die Person einfach nochmal im OGND (weil, der ist ja in den Normdaten nicht verlinkt) und wähle die richtige Person aus und klicke dann nochmal aufs unsichtbare Icon und schon kriege ich genau das, was ich vorher mit einem Klick in der Normdatenvorlage bekommen habe? Das ist tatsächlich ungeheuer praktisch :-) PDD 23:13, 16. Mai 2012 (CEST)
Für Personen funktioniert der PICA-Link weiterhin (die rote Meldung kommt nur beim Aufruf der Basis-URL, nicht bei konkreten Aufrufen wie [17]). Allerdings beruht dieser Aufruf auf der internen Identnummer im ILTIS-System der DNB, die ist nur bei Personen und bei seit der GND-Einführung neu erezeugten Datensätzen identisch mit dem Normdaten-Identifier. Die Regensburger Verbundklassifikation muss man z.B. mit der Nummer 950181226 zur Anzeige bringen, wir kennen aber nur die offizielle Nummer 4449787-8. Da der fragliche PICA-Katalog der alte Katalog des DMA zu sein behauptet, sind Schlagworte dort konsequenterweise noch nicht einmal recherchierbar, der einzige mir bekannte Weg zum Feststellen der internen Nummer erfordert Registrierung und besteht darin, den Datensatz in MARC-Format über den Datenshop herunterzuladen (oder die SRU-Schnittstelle zu benutzen, die erfordert allerdings ebenfalls Registrierung).
Das soeben gesagte gilt in abgewandelter Form für den OGND-Katalog, da dort zwar eine Recherche nach echten Normdaten-Nummern prinzipiell möglich ist (die internen Nummern des "Zitierlinks" sind die des SWB und daher nirgendwo identisch mit den offiziellen Normdatennummern) und wir auch direkt eine Rohdaten-Anzeige zu 11875856X erzwingen können. Allerdings müssen wir der GND-Nummer vorher ansehen, ob sie Ex-PND, Ex-GKD, Ex-SWD ist, denn 4449787-8 benötigt derzeit Recherche über einen anderen Index! -- Thomas Berger (Diskussion) 00:20, 17. Mai 2012 (CEST)
Ich würde daraus das Fazit ziehen, dass (da, um die gewohnte Funktionalität zu erzeugen, der PICA-Link sowieso nur bei TYP=p angezeigt werden soll und es dabei völlig gehupft wie gesprungen ist, ob das dann auf das alte oder das neue verlinkt) der PICA-bzw.-Rohdaten-Link jetzt also wieder eingefügt werden kann? PDD 00:40, 17. Mai 2012 (CEST)

Sollte man die PICA/OGND etc.-Anzeigemöglichkeiten vielleicht lieber in die Wikipedia-Personensuche aufnehmen als in die Normdatenleiste? Oder nochmal anders gedacht: wieso zeigt die DNB eigentlich keine Rohdaten mehr an, oder wenigstens einen Link darauf? Einer dieser hirnrissigen "unsichtbaren" Links wie im alten OPAC würde es für unsere Zwecke ja auch schon tun. Das DNB-Portal ist in dieser Hinsicht einfach nicht vollständig. --AndreasPraefcke (Diskussion) 08:51, 17. Mai 2012 (CEST)

Ich würde das so sehen: Sobald entweder DNB-Portal oder Toolserver-Personensuche aus der normalen Anzeige heraus mit einem Extra-Klick vollständige Rohdaten (möglichst sogar in einem vernünftigerem Format als das derzeitige PICA+-Internformat) zeigen, können wir auf den PICA-Link in der Normdatenleiste verzichten. -- Thomas Berger (Diskussion) 11:44, 17. Mai 2012 (CEST)

"Universelle" OGND-Suchanfrage für die direkte Rohdatenanzeige "PICA" aller Normdatentypen: http://swb2.bsz-bw.de/DB=2.104/CMD?ACT=SRCHM&ACT0=SRCH&IKT0=2011&TRM0={ID}&ACT1=%2B&IKT1=2012&TRM1={ID}&ACT2=%2B&IKT2=2013&TRM2={ID}&PRS=PP

  1. SWD 4449787-8
  2. PND 118603701
  3. GKD 5149652-5
Frage zum OGND-Katalog: Sind das immer aktuelle Daten oder entsprechen die den GND-Lieferungen alle paar Monate? Beim DNB-Katalog (PICA) sind die Daten ja praktisch tagesaktuell... --APPER\☺☹ 13:35, 17. Mai 2012 (CEST)
Der Katalog scheint eine "Auskopplung" aus der SWB-Verbunddatenbank, die wiederum per OAI-Schnittstelle die Änderungen in der GND eigentlich ~zeitnah~ nachverfolgen sollte. Konkret ist allerdings der heute gegen 10:00 angelegte 2118855-5 noch nicht sichtbar, die Vorgängerkörperschaft 2008801-2 in der OGND hat einen Link auf ihren Nachfolger, der führt aber ins Leere... -- Thomas Berger (Diskussion) 13:58, 17. Mai 2012 (CEST)
Finde gerade den Link nicht, hatte aber gelesen, dass der OGND im 5-Minuten-Takt aktualisiert wird. Tagesaktuell sollte er auf jeden Fall sein (und kein Vergleich mit VIAF, wo bestenfalls 1x pro Monat neue Daten eingespielt werden). --Kolja21 (Diskussion) 15:21, 17. Mai 2012 (CEST)
Vermutlich wird die SWB-Verbunddatenbank so häufig aktualisiert. VIAF bezieht GND-Daten auch recht aktuell (täglich, m.W. per OAI), nur die völlige Neuberechnung aller Cluster ist ca. einmal im Monat. -- Thomas Berger (Diskussion) 15:59, 17. Mai 2012 (CEST)
VIAF: Es werden ein paar Buchtitel drangehängt, aber auf Neueinträge muss man mehrere Wochen warten. So die offizielle Auskunft eines VIAF-Mitarbeiters. (Aktuell habe ich zwei, drei Änderungen in der GND von Anfang April notiert, die bislang immer noch nicht in VIAF angezeigt werden.) Gruß --Kolja21 (Diskussion) 21:15, 17. Mai 2012 (CEST)

Motivation erläutern

Bei Wikipedia Diskussion:Kurier gibt es wie schon manchmal zuvor die Frage, warum die Normdaten für alle angezeigt werden und was das überhaupt ist. Ich würde ja gerne auf Normdatei verweisen, aber der Artikel ist einigermaßen unverständlich und zeigt m. E. nicht, wozu Normdaten außerhalb eines einzelnen Bibliothekskatalogs überhaupt gut sein sollen. Auch WP:Normdaten zeigt die Ziele der Normdatenverknüpfung nicht recht auf. Da wäre einiges zu ergänzen. --AndreasPraefcke (Diskussion) 09:10, 21. Mai 2012 (CEST)

Wichtigste Arbeiten nach der Ersetzung der Vorlage

Hier kann ich nichts helfen, daher von mir erst mal nur einige Punkte (mit herzlichem Dank, wie lange es auch dauern mag): --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)

  • normdaten.js von Schnark müsste GND mit Typ p erfassen und die PNDfehlt-Funktionalität umstellen, sowie SELIBR durch NDL erstzen (das kann mit VIAF allerdings noch nicht befüllt werden, ein leeres Feld reicht) --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)  Ok
  • Apper-Tool (Wikipedia-Personensuche) müsste auch die GND (mit Typ p) erfassen. Am besten alle, auch Mickey Maus und Adelsfamilien, standardmäßig suchen und finden könnte das Tool ja vielleicht weiterhin nur Männer und Frauen, aber über die GND angesprochen eben auch diese anderen.--AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)  Ok
Das hab ich grad implementiert, läuft grad ein erstes Mal, aber bei der aktuellen SQL-Performance auf dem Toolserver macht Entwicklung grad keinen Spaß. Hoffe einfach, dass es funktioniert. Alle Artikel, die jetzt schon eine GND hatten, sind leider erstmal nicht erfasst - wenn das ganze funktioniert werde ich mal einen Gesamtlauf machen, um auch die zu erfassen. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)
  • Apper-Tool (Wikipedia-Personensuche) müsste auch die GNDName (mit Typ p) erfassen und mit den BEACON-Dateien vergleichen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)  Ok
Personeninfo-Tool sollte jetzt vollständig auf GND umgestellt sein. --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)
Auch das ist erledigt: siehe http://toolserver.org/~apper/pd/person/gnd-redirect/de/1021397091 . Und auch wenn da "person" in der URL ist, funktioniert das mit allen GNDs: http://toolserver.org/~apper/pd/person/gnd-redirect/de/1006609-3 --APPER\☺☹ 23:43, 11. Mai 2012 (CEST)
  • Die Wikipedia-BEACON-Datei müsste auch die Artikel mit GND und Typ p enthalten, und natürlich weiterhin auch die vielen mit PND.
  • Eine weitere komplettere BEACON-Datei müsste außerdem die Artikel mit TYP=p, leerem Feld GND, aber vorhandenem GNDName erfassen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
  • Die "Mutter aller Botläufe" müsste alle PND= in TYP=p und GND= ersetzen. Vielleicht am besten erst im Juli, damit nicht-individualisierte und Weiterleitungen vorher ausschließen können und dann extra behandeln. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
Ich weiß immer noch nicht, ob das sinnvoll ist. Was spricht denn im Fall "PND" dagegen, dass "PND=123" ein Kürzel ist für "TYP=p|GND=123"? Über 180.000 Artikel mit einem Bot... uiuiui. --APPER\☺☹ 19:21, 11. Mai 2012 (CEST)
Wir könnten z. B. erst mal nur bei Bedarf ändern (also z. B. den Interwiki-Bots und Rechtschreibhelferlein sagen, dass sie bei Personen mit PND das grundsätzlich mit ändern sollen, wenn sie die Artikel ohnehin anfassen). Und wenn dann nächstes Jahr noch ein paar tausend übrig sind, kann man die immer noch irgendwie machen (das sind dann wohl eh so Artikelleichen, die anzusehen sich irgendwie lohnen wird). Sobald die Tools GND auslesen können und die dann auch sicher in den BEACON-Dateien landen und es einen Resolver gibt, könnten wir die Botbetreiber damit beauftragen. Wir würden uns zurücklehnen und könnten uns weiterhin auf Vorlage:PND, GKD, SWD usw. konzentrieren. Klingt eigentlich gut, ja. --AndreasPraefcke (Diskussion) 19:28, 11. Mai 2012 (CEST) PS: WP:Bots/Anfragen gestellt. --AndreasPraefcke (Diskussion) 14:14, 16. Mai 2012 (CEST)
  • Wartungsliste: Artikel mit Normdaten, bei denen Felder GND _und_ PND befüllt sind. Geforderte Aktion dann: Prüfen und PND dann löschen. Alternativ könnte auch die Vorlage eine solche Wartungskategorie einfügen (soll ich das machen?) Theoretisch wäre das irgendwann mal auch für SWD, GKD etc. sinnvoll, aber durch die vielen Dubletten und die insgesamt viel geringere Verbreitung in der Wikipedia ist das sehr nachrangig. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)

Alle können helfen dabei, die

  • Vorlagen DM, SWD, GKD, PND und auch PNDfehlt nach und nach umzustellen und überflüssig zu machen. Meist ergeben sich ja doch neue Möglichkeiten mit VIAF und der GND, so dass eine rein automatische Abarbeitung vielleicht gar nicht so sinnvoll ist. Wer Automatisierungsmöglichkeiten sieht, möge dennoch seine Bots anwerfen. --AndreasPraefcke (Diskussion) 17:31, 11. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

Dublettenbereinigung

Die Technische Universität Berlin kommt in der GND zweimal vor: 2114678-0 und 4005079-8. Ich bin etwas ratlos, was in solchen Fällen passieren soll.

  • Beide Nummern aufnehmen? Allerdings wird dann nur die zuletzt aufgeführte ausgegeben.
  • Bei Wikipedia:PND/Fehlermeldung hinzufügen? Gilt dort die Beschränkung auf Personendaten eigentlich noch? Andererseits sind schon jetzt so viele Fehlermeldung aufgelaufen, die auf Bearbeitung warten ...
  • Abwarten, Tee trinken und hoffen, dass irgendwann (gibt es hierfür eigentlich einen konkreten Termin) im großen Stil Dubletten bereinigt werden?

--Monsieur Becker (Diskussion) 23:27, 19. Mai 2012 (CEST)

Abwarten, Tee trinken und auf die angekündigte baldige große Dublettenbereinigung warten. Momentan ist die GND leider unbrauchbar für Nichtpersonen. Wie immer bei der DNB wird erstmal großflächig Müll auf die Benutzer geschüttet und dann irgendwann mal mit dem Putzen angefangen. --AndreasPraefcke (Diskussion) 00:02, 20. Mai 2012 (CEST)

Holla Monsieur, sehe ich ähnlich, auch wenn nicht so drastisch. Die Chancen stehen gut, dass die SWD- / GKD-Dubletten noch in diesem Jahr zusammengeführt werden. In den betreffenden Fällen lasse ich die veralteten Vorlagen SWD und GKD stehen oder wähle eine der beiden Nrn. aus und vermerke die Dublette in den Anmerkungen (Parameter "REMARK"). Gruß --Kolja21 (Diskussion) 00:07, 20. Mai 2012 (CEST)
Ja, war schon drastisch ausgedrückt. Aber wenn man eine "Normdatei" auf die Menschheit loslässt, sollte die halt auch etwas normieren, und nicht für jeden Pups fünf verschiedene Nummern anbieten. Wenigstens die 16 Bundesländer und die 100 größten deutsche Städte hätte man ja z. B. mal in ein, zwei Stunden mit Hand zusammenfassen können, bevor man großartig die GND mit "Geografika" einführt. --AndreasPraefcke (Diskussion) 00:24, 20. Mai 2012 (CEST)
Was mich mehr stört ist, dass aus den Daten nicht mal hervorgeht, welche regionale GND-Redaktion die entsprechende Dublette angelegt hat. Habe aus Neugierde vor ein paar Tagen dem hbz-Verbundkatalog eine doppelten Eintrag gemeldet und erhielt am nächsten Morgen die positive Rückmeldung: "Der dublette Personennamensatz ist zur Bereinigung vorgemerkt, die Bearbeitung kann jedoch erst im Juni erfolgen." Wenn ich an die "Vielfalt" (um es freundlich auszudrücken) denke, die sich bei uns in Sachen GND-/PND-/DMA-/SWD-/GKD-Vorlagen im Laufe der Jahre entwickelt hat, sind vermutlich auch nicht alle Wiki-Autoren auf Anhieb von unserer Arbeit angetan ;) Fröhliches Schaffen --Kolja21 (Diskussion) 00:44, 20. Mai 2012 (CEST)

Wozu die Aufregung? Das Schlagwort ist seit mindestens Juli 1988 in der SWD, der Körperschaftssatz seit Dezember 1990 in der GKD (viel früher wäre das auch kaum möglich gewesen, denn da war es die "Technische Universität <Berlin, West>"). [Man sieht sehr schön, dass hier die GKD zwei Entitäten kannte, und die SWD nur eine: Da muss dann nachträglich dort differenziert oder hier zusammengefasst werden, so genau kenne ich die Regeln nicht, so richtig automatisch wird es in diesem Fall jedenfalls nicht gehen können]. Bibliothekare haben jedenfalls lange geglaubt, dass sie mit der strikten Trennung der beiden Sphären der Formal- und Sacherschliessung mehr Probleme lösen können als sie sich durch die Dopplung von Datensätzen zur (tendenziell) gleichen "Entität" einfangen. Jetzt sind endlich die diversen Normdateien vereinigt und man hatte bei der Vorbereitung beschlossen, den komplexen Umstellungsprozess (da hingen ja auch noch die "Spiegel" der Normdateien in den bibliothekarischen Regionalverbünden und wiederum deren Sattelliten-Datenbanken in den teilnehmenden Bibliotheken dran) nicht auch noch mit einer gleichzeitigen Zusammenfassung zigtausender Datensätze zu überfrachten, sondern dies "live" ab etwa Juni zu tun, wenn die Regionalverbünde die Umstellung vom April fertig verdaut haben werden und wieder zu einem annähernden Normalbetrieb zurückgekehrt sind. -- Thomas Berger (Diskussion) 02:16, 20. Mai 2012 (CEST)

Vielen Dank für die Rückmeldungen, ich werde dann erstmal vom weiteren (sporadischen) Einpflegen von GND-Daten absehen, um doppelte Arbeit zu vermeiden. Grüße --Monsieur Becker (Diskussion) 08:34, 20. Mai 2012 (CEST)

Hallo. Ich sehe das anders: Wenn du Lust drauf hast, GNDs einzupflegen oder sowieso darüber stolperst: pack sie ruhig in die Artikel (also eine der GNDs). Werden später zwei GNDs zusammengelegt, gibt es immer eine Weiterleitung - und das lässt sich automatisiert prüfen. Aus GND 1 GND 2 zu machen, nachdem sie auf einer Wartungsliste aufgetaucht ist, macht ja weit weniger Arbeit als überhaupt erstmal eine GND zu recherchieren - im Zweifelsfall kann das (wenn es zuviel wird) sogar automatisiert gemacht werden (wobei ein kurzes Raufschauen natürlich nie schadet). Also: füge ruhig GNDs ein. --APPER\☺☹ 14:54, 20. Mai 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

Umgang mit GND auf viaf.org

Wahrscheinlich ist es den meisten schon aufgefallen, die übrigen wollte ich nur kurz darauf hinweisen, dass auf viaf.org jetzt (seit der Umstellung?) erfreulicherweise Tn als undifferentiated markiert werden. --Mai-Sachme (Diskussion) 21:27, 1. Jun. 2012 (CEST)

Super, das ist ein riesen Fortschritt. Mir war nur aufgefallen, dass beim letzten Update etliche Personen/Namen, die bereits zusammengeführt waren, getrennt wurden. Offenbar sind die Regeln, wann Personen gemergt werden, strenger geworden. --Kolja21 (Diskussion) 00:10, 2. Jun. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

Wurzbach

Von Diskussion:Gemeinsame_Normdatei hierhin verlagert

Wurzbach hat oft mehr als 1 Artikel zu einer Person in seinem Lexikon. Offenbar kann man in 2 Artikel die GND eintragen, es wird aber nur 1 Wurzbachartikel angezeigt. Beispiel: Karl Ambrosius von Österreich-Este, siehe Literatur. Bei „Seealso“ (von Wikisource aus) wird nur der Habsburg-Artikel angezeigt, nicht aber der Este-Artikel. Wünschenswert wäre es, wenn alle Wurzbach-Artikel im „See-also-Fenster“ angezeigt würden. Also auch Nachträge, Edrgänzungen, Namensvarianten, (die meistens auch Ergänzungen bringen). Zabia (Diskussion) 19:48, 30. Jul. 2012 (CEST)

Technisch sieht das so aus, daß Benutzer:APPER einen Resolver aufgesetzt hat (http://toolserver.org/~apper/pd/person/gnd-redirect/ws-blkoe/) und die automatisiert die Liste aller GND-Nummern zu BLKÖ-Einträgen veröffentlicht. Da ist dann die Nummer 130252972 in der Tat doppelt drin, aber was nutzt das, weil es ja beide Male auf dieselbe URL http://toolserver.org/~apper/pd/person/gnd-redirect/ws-blkoe/130252972 geht? Eine Lösung wäre, dass der Resolver ausgebaut wird, und in solchen Fällen zunächst eine Auswahl ("Liste der Fundstellen zur Person") präsentiert, die andere bestünde darin, den Resolver zu umgehen und den Toolserver eine "allgemeine" BEACON-Datei produzieren zu lassen, die explizit die konkreten Lemmata und WS-Links enthält.
Ich weiss nicht, ob sich der Aufwand lohnt: Es sind 37 Personen betroffen (darunter auch noch Zuordnungsfehler wie den derzeit angeblich vierfachen Jakob Amigoni und beim Este-Beispiel verweist der eine Artikel bereits im Text auf den anderen und die Rückrichtung wird durch eine WS-Fussnote abgedeckt. -- Thomas Berger (Diskussion) 22:38, 30. Jul. 2012 (CEST)
Ich denke auch, dass da innerhalb Wikisource ohnehin gegenseitige Links vonnöten sind (schon aus Benutzerfreundlichkeit für alle anderen, die die Artikel nicht über BEACON finden, also wohl 99,99% der Leser), da ist der Aufwand für eine Umprogrammierung dann momentan schlicht zu hoch für die paar Fälle. --FA2010 (Diskussion) 12:07, 31. Jul. 2012 (CEST)
Ich danke für Eure Antworten. Versteh ich das richtig: Ich darf, wenn angezeigt, im Wurzbach GND-Nummern auch mehrfach zuordnen? Oder ist genau das total falsch?
Wieviele Personen da betroffen sind, weiß nicht mal ich, und ich kenn inzwischen einige tausend Wurzbachlemmta.
Sicher bemüh ich mich, interne Anmerkungen (so wenig wie möglich, so viel wie nötig) zu geben, allerdings paßt das nicht immer. Wenn zu so einer Person ein WP-Artikel vorhanden ist, dann vergeb ich WP-links in der Wikisource mehrfach, nur gibt es relativ wenig WP-Artikel, auch wenn die Personen relevant wären. Ich arbeite den Wurzbach bändeweise ab, da kann es sein, dass Falsches noch einige Zeit nicht korrigiert wird. Die erwähnten Artikel werd ich mir jedenfalls vornehmen. Mal sehen. Mir gehts jedenfalls sicher nicht um unzumutbaren Mehraufwand für irgendwen, ich frage bloß, weil ich Antworten brauch. Zabia (Diskussion) 13:39, 31. Jul. 2012 (CEST)
Meintest Du "WS-Links in der Wikipiedia"? -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)
Auch. Eigentlich hab ich gemeint, dass es zutreffendenfalls mehrere Wurzbach-Lemmata in Wikisource gibt, die denselben Wikipedia-Link aufweisen. Die verlink ich aber nur in Ausnahmefällen mehrfach in die WP, z.B. bei durch mich geteilten Adels-Artikeln (Wappen), bzw. beim Schreibers, aber nur, wegen der angenommenen Relevanz der französischen Quellen. Zabia (Diskussion) 14:38, 31. Jul. 2012 (CEST)
Die falschen Amigoni-GNDs dürften Copy&Paste-Fehler gewesen sein. Blöderweise waren das 2. korrigierte Artikel, die da verschlimmbessert wurden. Inzwischen hab ich das korrigiert. Herzlichen Dank für den Hinbweis! Zabia (Diskussion) 13:51, 31. Jul. 2012 (CEST)
Eine tagesaktuelle Auswertung der BEACON-Datei bezüglich Dubletten bei den GND-Nummern findest Du hier. -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)
Oft stellt sich ja der Erkenntnisgewinn gerade erst dann ein, wenn doppelt zugeordnete GND-Nummern auffallen. Sei es, dass der Normdatensatz fälschlich mehrere Personen identifiziert oder sonstwie mehrdeutig ist, oder dass die Quelle unbemerkt zwei im Alphabet auseinander liegende Lemmata zur gleichen Person hat. D.h. in WS sollte natürlich jeder Artikel eine GND-Nummer bekommen, sofern sie zutrifft (sofern mehrere zutreffen, also GND-Dubletten vorliegen, muss das anders geregelt werden: Die Bereitwilligkeit, mit der entsprechendes zur ADB auf WP:PND/F durch die DNB akzeptiert wurde, schien von Monat zu Monat zu variieren, direkte Meldungen an die DNB dürften erfolgversprechender und befriedigender sein). Wir sollten aber davon ausgehen, dass i.A. Zugriffe über die Person nicht zu simultaner Anzeige oder Auswahlmöglichkeit mehrerer Artikel führen, sondern bei einem willkürlichen der mehrfachen Artikel zur Person landen. D.h. jeder muss aus sich heraus, also Text oder WS-Anmerkung auf seine Gegenstücke hinweisen. Nur so kann man auch Suchmaschinenbenutzer optimal bedienen. -- Thomas Berger (Diskussion) 14:17, 31. Jul. 2012 (CEST)
Danke für die hilfreichen Antworten. Ich hab jedenfalls festgestellt, dass die DNB, was Nummernsuche betrifft extrem benutzerfreundlich, extrem schnell auch, wurde, im Gegensatz zu den Zeiten der ADB. Den Link mit den Dubletten, den seh ich mir auch noch an. Danke! Zabia (Diskussion) 14:38, 31. Jul. 2012 (CEST)
Ich geh jetzt so vor, dass ich GND nur 1x vergebe, schon um zu vermeiden, dass ich immer die gleichen Dubletten abarbeiten müsste. An sich hatte ich gestern alle BLKÖ-GND-Dubletten entfernt, das sieht man aber noch nicht in der Liste. Zabia (Diskussion) 14:12, 1. Aug. 2012 (CEST)
Risiko ist höchstens, dass jemand anderes die entfernten wieder einträgt, weil er ja nur die Leerstelle sieht. Die Aussagen zur Auswertungsliste muss ich korrigieren, sie wird leider doch nicht automatisch generiert, sondern nur recht häufig (außer in den nächsten Wochen). Derzeit ist sie gelöscht, da im heutigen Toolserver-Abzug tatsächlich keine Dubletten vorlagen. -- Thomas Berger (Diskussion) 10:56, 2. Aug. 2012 (CEST)
Danke jedenfalls, für die hilfreichen Hinweise. Ich hab auf der Diskussionsseite zum BLKÖ einen Hinweis (GND und Dubletten) gesetzt, mit Glück wird er gelesen. Die Abfrage-Liste hab ich in meinen Favoriten, ich seh halt ab und an nach. Lieben Gruß, aus Linz, Österreich. Zabia (Diskussion) 13:26, 2. Aug. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

Mehrere Datensätze

Hallo, wie verfährt man, wenn man wie hier mehrere Datensätze zur Auswahl hat? --91.39.168.53 21:58, 6. Aug. 2012 (CEST)

Kurz: Nach Belieben. Die Dubletten werden hoffentlich in der GND bald deutlich weniger werden. Ich hab das in diesem Fall mal durchgeführt. --FA2010 (Diskussion) 14:28, 7. Aug. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

DNB kann jetzt auch das Alphabet!

Die Suchergebnisse nach Personennormdatensätzen sind nun endlich alphabetisch nach Nachname, Vorname sortiert, und danach nach Geburtsjahr. Das ist zwar immer noch scheiße (weil man nur 10 Ergebnisse auf einmal anzeigen kann, und weil "Otto Mueller" erstmal seitenweise "Carl Otto Muellers" etc. anzeigt), aber nicht mehr ganz so scheiße wie bisher. --FA2010 (Diskussion) 20:11, 10. Aug. 2012 (CEST)

Ein Tipp, falls du ihn noch nicht kennst: Benutze die Druckansicht, da bekommst du 500 Datensätze mit einmal sehen. Leider aber auch nicht mehr. --Das Robert .... gibs mir! 15:07, 16. Aug. 2012 (CEST)
Nein, kannte ich nicht, danke. --FA2010 (Diskussion) 12:43, 22. Aug. 2012 (CEST)
Archivierung dieses Abschnittes wurde gewünscht von: 84.161.204.138 14:14, 30. Aug. 2012 (CEST)

Unpassende / kollidierende Typen

Ich wollte gerade mal schauen, zu welchen Nicht-Personen-Artikeln man denn direkt noch passende LCCN- und VIAF-Datensätze finden könnte. Bin dabei über die Georg-von-Neumayer-Station (eine Forschungsstation in der Antarktis) gestolpert. Passende VIAF-ID und LCCN existieren und weisen es als geographisches Objekt aus. In der DNB dagegen existieren zwei Datensätze ([18], [19]), aber beide (IMO nicht ganz korrekt) als Organisation. Was macht man am Besten in solchen Fällen? --Kam Solusar (Diskussion) 21:36, 20. Mai 2012 (CEST)

Bei der Typ-Angabe orientieren wir uns an den DNB. Was die Dubletten betrifft, so stammt der eine Datensatz aus der SWD-, der andere aus der alten GKD-Normdatei. Wähle eine Nr. aus, ab Juni werden die Dubletten sukzessive von der DNB zusammengeführt. Gruß --Kolja21 (Diskussion) 21:55, 20. Mai 2012 (CEST)
Mit den Dubletten hab ich kein Problem, halte mich mit der Eintragung derzeit aber ein bißchen zurück bis dann mal die Dubletten-Bereinigung erfolgt ist. Die unterschiedlichen Typen finde ich aber schon etwas problematisch. Sollten wir z. B. mal dazu kommen, auch zu anderen Typen als nur Personen eigene Tools und Link-Sammlungen wie die Personensuche anbieten zu können, sollten wir sehr bemüht sein, eine möglichst konsistente und fehlerfreie Datengrundlage zu haben. In diesem Fall frage ich mich schon, warum hier ein großer Container am Ende der Welt in der GND als Organisation klassifiziert ist und nicht eher als geografisches Objekt. Auch Expeditionen finden sich z. B. derzeit in der GND bunt verteilt auf Organisationen, Sachbegriffe (Historisches Einzelereignis) und Veranstaltungen. Nach den Renovierungsarbeiten infolge der Zusammenlegung mag das vielleicht dann anders aussehen, es wäre aber nicht schlecht, wenn es in solchen Fällen die Möglichkeit gäbe, direkt eine Korrekturanfrage zu stellen wie es etwa bei Personendatensätzen möglich ist. --Kam Solusar (Diskussion) 06:10, 22. Mai 2012 (CEST)
Hi Kam, das Problem sehe ich eher auf unserer Seite. Ich wollte z.B. vorhin dem Euratom-Vertrag eine Werk-GND spendieren, landete dann aber per Weiterleitung auf der Organisation Europäische Atomgemeinschaft. Mal sehen, wie sich das weiter entwickelt. Bislang haben wir uns ja fast ausschließlich auf Personen beschränkt, und das wird vorerst auch der Schwerpunkt für die Normdaten bleiben. Gruß --Kolja21 (Diskussion) 07:35, 22. Mai 2012 (CEST)
Ja mal schauen. Es scheint ja beispielsweise bei vielen geografischen Dingen die Möglichkeit zu geben, sie sowohl als Geografikum als auch als Körperschaft zu sehen (Städte, Kreise, Länder, etc..). Oder bei Flughafen vs Flughafenbetreibergesellschaft, Nationalpark vs Nationalparkbetreiber, etc. Da müssen wir mal schauen, wie wir so etwas am besten handhaben. Wahrscheinlich wirds nicht in allen Fällen einfach per Weiterleitung klappen. --Kam Solusar (Diskussion) 06:13, 25. Mai 2012 (CEST)

PPNs einbinden?

Hallo, mit {{LBMV PPN}} und {{HessBib PPN}} gibt es noch zwei Vorlagen zu Landes-bibliographischen Normdateien. Können/sollen die irgendwie in die Normdaten integriert werden? --emha d|b 13:50, 29. Mai 2012 (CEST)

Danke für den Hinweis. Ich habe die Kategorie:Vorlage:Datenbanklink Normdaten erstellt, damit diese selten genutzten Vorlagen nicht übersehen und demnächst aktualisiert (PND durch GND ersetzen) werden. --Kolja21 (Diskussion) 14:33, 29. Mai 2012 (CEST)

In beiden Fällen handelt es sich um lokale PPNs (Pica Production Numbers) des jeweiligen Katalogisierungssystems, nicht um PND- oder GND-Nummern. -- Thomas Berger (Diskussion) 17:18, 29. Mai 2012 (CEST)

Stimmt, aber auf den Dokumentationsseiten zu den lokalen Normdaten wird Bezug auf die PND genommen, daher müssten sie überarbeitet werden. Es gibt übrigens auch noch eine {{LBMV SWW}}, die sogar auf Englisch und Arabisch vorliegt. --Kolja21 (Diskussion) 17:50, 29. Mai 2012 (CEST)

Als Nichtbibliothekar muss ich mal doof fragen, ob die Landesbibliotheken für Personen und Schlagwörter nicht auch die GND verwenden? --Monsieur Becker (Diskussion) 19:42, 29. Mai 2012 (CEST)

Das sind Landesbibliographien: Da geht es dann zum Teil auch um Bücher und v.a. Aufsätze, die nicht "im Besitz" einer konkreten Bibliothek sind. Traditionell sind das eigene Abteilungen mit eigenen Mitarbeitern und präsentiert wird das in einem eigenen Katalog. Technisch ist das allerdings überall seit vielen Jahren in die allgemeinen Verbunddatenbanken integriert und daher stelle auch ich mir als bibliothekarisch eher vorbelasteter Mensch seit langem dieselbe Frage ... -- Thomas Berger (Diskussion) 21:17, 29. Mai 2012 (CEST)

Die (regionale) PPN ist die interne Nummer, die es bereits vor der Einführung der GND gab. Sie wird weiterhin verwendet, ist jetzt aber mit der (überregionalen) GND verknüpft. Beispiel: Stephen King im Landesarchiv BW. Die PPNs der Bibliotheksverbünde sind es, die uns die Vielzahl an Dubletten beschert haben. --Kolja21 (Diskussion) 01:23, 30. Mai 2012 (CEST)

Die Landesbibliographie BW ist da vorbildlich in der Hinsicht und verwendet GND und stellt auch eine BEACON-Datei bereit. Ich hoffe, dass die anderen da bald nachziehen, dann sollten wir die Vorlagen natürlich umstellen. --AndreasPraefcke (Diskussion) 08:55, 30. Mai 2012 (CEST)

Aus dem Gesagten schließe ich, dass keine Notwendigkeit besteht, die PNNs einzubinden. Oder? Wie steht es eigentlich mit einer Seite analog zu GeoHack oder der ISBN-Suche, bloß für GND? --Monsieur Becker (Diskussion) 19:50, 30. Mai 2012 (CEST)

Diese PPNs sind offensichtlich Nummern von Normdatensätzen ihrer jeweiligen Anwendungen, für die Normdaten-Vorlage hängen wir hier die Latte aber einige Löcher höher. Ich hatte vor einiger Zeit bei Vorlage_Diskussion:Normdaten/Archiv/2012#NEBIS_aufnehmen ein paar Kriterien zu formulieren versucht, eigentlich läuft aber alles darauf hinaus, ob solche Nummern den Anspruch erheben und das Potential haben, über die eigene Anwendung hinaus wahrgenommen zu werden.
Zur zweiten Frage: Mal abgesehen davon, wie sich Dbpedia und Wikidata entwickeln werden, ist die "Personensuche" auf dem Toolserver [20] eigentlich auf dem Weg, diese Funktion wahrzunehmen. Lt. Statistikseite werden da derzeit etwa 100 Quellen eingebunden, anders als bei der ISBN-Suche ist allerdings schon vorher bekannt, ob die Quelle eine konkrete Person nachweist, insofern gibt es da nie 100 Links. Die Sache ist noch ausbaufähig [21], denn http://beacon.findbuch.de/seealso/pnd-aks weist über 170 Quellen zu GND-Personen nach, die Liste [22] kennt noch mehr Datenbanken, bei denen immerhin eine Recherche nach Normdatennummern möglich ist (ohne dass durch eine BEACON-Datei vorab bekannt ist, ob sie sich lohnt) und auf dem Toolserver wären durch Auswertungen von Interwiki-Links und Live-Abfragen etwa an VIAF auch Ergebnisanzeigen möglich, bei denen im Hintergrund durch simultane Berücksichtigung weiterer Identifier-Systeme für dieselbe Person oder Ressource noch mehr herangeschafft werden kann. -- Thomas Berger (Diskussion) 23:07, 30. Mai 2012 (CEST)

Vorlagen SWD und GKD ohne Vorlage Normdaten

Analog #Stand Auflösung der Vorlage:PND dasselbe für Vorlage:SWD und Vorlage:GKD (für Gebietskörperschaften etwa kamen tendenziell beide infrage): Die Liste Schlagworte, Geographika, Körperschaften mit Vorlage:SWD und/oder Vorlage:GKD ohne Vorlage:Normdaten führt alle Verwendungen dieser beiden Vorlagen auf.

Mir scheint da einiges an Quatsch drin zu stehen (etwa bei Geographie von Istanbul oder Geschichte der Sklaverei halte ich es ohne nachzusehen bereits für ausgeschlossen, dass es dazu Normsätze gibt), und im Fall von Verwaltungseinheiten wurde schon des öfteren diskutiert, ob die Normdaten-Nummer nicht eher in die Vorlage:Infobox Verwaltungseinheit in Deutschland bzw. ihre Derivate gehört und da auch einmal automatisiert eingetragen werden kann: Oft gibt es in der DNB keine Literatur über die Verwaltungseinheit und der Nachweis der von ihr herausgegebenen Literatur ist in der DNB uneinheitlich und fast nicht existent (vermutlich hebeln da die Archivgesetzte das Dépot legal aus, genaues weiss ich aber nicht).

Die Liste ist also eher zum anschauen gedacht, nicht zum abarbeiten! -- Thomas Berger (Diskussion) 12:59, 31. Mai 2012 (CEST)

Hab gleich mal in die Liste reingeschaut. Die Normdaten (bzw. Literaturhinweise) für Geschichte der Sklaverei müssen nach Sklaverei verschoben werden.[23], [24] Bei den regulären Fällen können, falls nur {{GKD}} oder {{SWD}} vorliegen, selbige durch {{DNB-Portal}} ersetzt und {{Normdaten}} ergänzt werden.[25] Unkorrigiert würde ich vorerst nur jene Fälle lassen, wo GKD und SWD gemeinsam eingetragen sind (und warten, bis die DNB die Dubletten bereinigt hat). --Kolja21 (Diskussion) 13:21, 31. Mai 2012 (CEST)

Frage nach einem "Normdatenkonsens"

Aufgrund einer Massenlöschung der GND-Daten zu Sachartikeln von Benutzer:Rainald62 hatte ich auf seiner Diskussionsseite nach den Grund gefragt. Meine Anfrage wurde gelöscht und in der Zusammenfassungszeile auf folgende Diskussionen Benutzer_Diskussion:Rainald62#Normdaten und Wikipedia_Diskussion:Richtlinien_Physik#Verlinkung_von_Normdaten_.28SWD.29 verwiesen. Rainald62 versteht den Sinn der Normdaten nicht und fragt nach einem Konsens bezüglich dieser Vorlage. Im Artikel Corioliskraft ist nun diesbezüglich ein Editwar entstanden. Konkret wird dabei Benutzer:Kam Solusar und seine fehlende Diskussionsbereitschaft angegriffen. (Aus meiner Sicht völlig aus der Luft gegriffen, da keiner die Diskussion im Portal Physik verfolgt und Kam Solusar auf seiner Benutzerseite nie angesprochen wurde.) Hinweise auf diese Diskussionsseite hat er auch bisher ignoriert. Ich bin nun ziemlich ratlos. Gibt es hier in der Wikipedia so eine Art Konsens oder was auch immer bezüglich der Normdaten, damit auch Rainald62 von der Sinnhaftigkeit der Normdaten überzeugt werden kann? Ziemlich ratlose Grüße --Silke (Diskussion) 23:40, 1. Jun. 2012 (CEST)

Hallo Silewe, danke für den Hinweis. Ich habe mich auf "Richtlinien Physik" dazu geäußert. Gruß --Kolja21 (Diskussion) 00:24, 2. Jun. 2012 (CEST)
Ich denke, Benutzer:Rainald62 ist ein Fall für die Vandalismusmeldung. Er interessiert sich weder dafür, was Normdaten sind, noch hat er Interesse an einer Diskussion. --Kolja21 (Diskussion) 00:56, 2. Jun. 2012 (CEST)
Ad hominem-Beitrag entfernt. Kein Einstein (Diskussion) 22:18, 3. Jun. 2012 (CEST)
Silke, ich verstehe deine Ratlosigkeit - allerdings gibt es da wohl ein Problem dergestalt, dass eine universelle Verlinkung wohl nirgends breit diskutiert wurde und nun genervte Reaktionen hervorrief. Es hat sich auf der dafür natürlich nicht eben optimal geeigneten Seite der Physiker eine einigermaßen konstruktive Diskusion entwickelt. (Woanders blieb das zwei Monate ohne Resonanz.) Thomas Berger hat imho eine praktikable Lösung vorgeschlagen. Ich möchte diese auch hier zur Diskussion stellen: Gibt es Einwände gegen „Normdaten vom Typ s (Sachbegriffe) sollen keine Anzeigebox erzeugen“? Damit wäre doch das Ärgernis (der einen) beseitigt, während die Vorteile noch vorhanden sind. Gruß Kein Einstein (Diskussion) 22:18, 3. Jun. 2012 (CEST)
Ich selber hatte nicht bemerkt, dass diese Diskussion bereits im Februar zum Einsatz der Vorlage:SWD gestartet war und jetzt anlässlich intensiver Umstellung auf die Vorlage:Normdaten wieder aufgeflackert ist. Bezüglicher ersterer waren Beurteilungen nach WP:WEB legitim (ob für in Kategorie:Datenbanklinks eingestufte Vorlagenverwendungen ein anderes Mass angelegt werden sollte, wäre allerdings auch einmal eine Diskussion irgenwo wert), bezüglich letzterer laufen sie ins Leere ("Normdaten" ist so etwas ähnliches wie Kategorien). Das ist aber ein ziemlich formalistisches Argument und dürfte unserem Hauptanliegen, dass möglichst niemand sich durch die Vorlagenverwendung provoziert fühlen sollte diese aus Artikeln zu löschen, nicht hilfreich sein. Auch in den Bibliotheken gibt es unterschiedliche Communities, Mathematikern z.B. sind die Schlagworte herzlich egal, weil sie seit jeher eine international akzeptierte Fachklassifikation haben. Dementsprechend sind Vollständigkeit und Pflege der SWD-Begriffe gerade im Bereich der Sachschlagworte von Fach zu Fach durchaus unterschiedlich und wir hier können das weder leugnen oder kurz- oder mittelfristig "reparieren" noch ist es unsere Aufgabe, Stellvertreterdiskussionen zu führen: Ob die SWD Bibliotheken glücklich macht, interessiert uns nur insofern, als wir Wert auf Verlinkungen zu einem System legen, das von einer möglichst breiten Community aktiv gepflegt wird. Und ob die SWD der Wikipedia nutzt, ist eine sehr unscharf gestellte Frage, mögliche Antworten sind "Nein, niemand hat vor die Wikipedia zu verschlagworten" oder "Ja, denn die SWD ist partiell crosskonkordanziert".
Bezüglich Personen hat es sich im Laufe der Zeit so entwickelt, dass wir die ursprügnliche Vorlage:PND einerseits in ihre "zeige-den-Benutzern-Literatur"-Funktionalität als Vorlage:DNB-Portal und andererseits in eher abstrakte Verlinkungen mittels Vorlage:Normdaten aufgespalten haben. Die Links in letzterer dienen primär zur Überprüfung der Zuordnung, wobei (etwa im Fall von VIAF oder NDL) ein Zusatznutzen auch für Normalbenutzer nicht auszuschliessen ist. Wartungsvorlagen wie Vorlage:PNDfehlt sind in einen <div class="catlinks metadata"> gesetzt und werden für Benutzer ausgeblendet, die nicht MediaWiki:Gadget-Personendaten.css (Achtung: historischer Name, gemeint sind Metadaten) aktiviert haben. Für Normdaten (<div class="catlinks normdaten-typ-X">) fehlt eine solche differenzierte Oberflächenbehandlung, allerdings werden einige Parameter der Vorlage in ein <span class="metadata"> gesetzt und sind damit auch nur den Benutzern mit aktiviertem Gadget sichtbar. Denkbar wären nun:
  1. ein eigenes Gadget für Normdaten (Standard wäre dann allerdings "on"?)
  2. Für gewisse Normdatentypen X ein Ausblenden von div.normdaten-typ-X in der allgemeinen load.php plus Reaktivieren im Rahmen des vorhandenen Helferleins Gadget-Personendaten.css (scheint mir logisch am saubersten)
  3. Anpassung der Vorlage:Normdaten, so dass bei gewissen Normdatentypen das Normdaten-div komplett zusätzlich die CSS-Klasse metadata spendiert bekommt (lässt sich in rein lokaler Regie durchführen)
-- Thomas Berger (Diskussion) 23:57, 3. Jun. 2012 (CEST)
Warum sollen wir die eigene Arbeit sabotieren: Normdaten eintragen, aber für den Typ s (Sachbegriff) nicht anzeigen? Ich wäre wohl nicht der Einzige, der in diesem Fall ganz auf den Eintrag verzichten würde. Dass sich bei einem Projekt dieses Umfangs sich ein, zwei Gegenstimmen finden, ist völlig normal. Niemand wird gezwungen, Normdaten einzutragen, aber wer sich die Arbeit macht, hat ein Recht darauf, dass sie nicht mit Kommentaren wie "Unsinn" oder "Wir wollen doch den Exzellenz-Status nicht gefährden" per Revert-Taste zerstört wird. --Kolja21 (Diskussion) 04:17, 4. Jun. 2012 (CEST)
Ad hominem-Beitrag entfernt. Darf man KeinEinstein fragen, was ihn dazu berechtigt, meinen Diskussionsbeitrag durch eine themenfremde Überschrift als Verlinkung zu ersetzen?
Einen persönlichen Angriff nach Ad hominem kann ich in meinem Text nicht ausmachen, auch keinen persönlichen Angriff nach WP-Regeln.
Von mir wurden dort Verhältnisse beschrieben, die das befremdende Wirken einiger anonymer Mitautoren, Physik-Redakteure und Admins konkret im Zusammenhang mit realen Konflikten innerhalb der WP betrifft, insbesondere zu Rainald62 dessen Verhalten hier von Kolja angesprochen wurde.
Wenn zu Rainald62 der Hintergrund aufgezeigt werden kann, können die hier an der Diskussion beteiligten Mitautoren sich orientieren. Das KeinEinstein hierzu sofort verschleiernd aktiv wird, passt haarscharf in das Profil von ihm, welches bereits in meinem von ihm gelöschten Beitrag steht. --Carl von Canstein (Diskussion) 08:10, 4. Jun. 2012 (CEST)

@Kolja21: Die Frage ist doch, wozu die Normdaten im Artikel nützlich sind. Das "taggen" der Artikel, beispielsweise zum automatisierbaren Verlinken ist wohl unbestritten sinnvoll. Wenn aber die für den Leser durch Anklicken sichtbaren Links von den Fachleuten als untauglich betrachtet werden, dann ist Bedarf für Verbesserung da. Kai-Martin hat ja Beispiele verlinkt, solche Angaben würden bei den Weblinks i.d.R. hochkant rausfliegen - und das zeigt das Problem für die Physiker auf, sichtbar stellen viele der Links eine Verschlechterung für den Leser dar. @Thomas Berger: So weit ich das verstehe, scheint deine Variante 2 gut. @Carl: Dein (übrigens wieder von sachlichen Fehlern garnierter) Beitrag geht am Thema vorbei. Es geht hier um eine inhaltliche Frage, die Normdaten. Kein Einstein (Diskussion) 14:02, 4. Jun. 2012 (CEST)

Hallo Kein Einstein, natürlich können auch die Links wertvoll sein, müssen aber nicht. Der Punkt ist doch, dass sich Autor A Arbeit macht, die Autor B per Revers-Button löscht und ihm Kommentarfeld dazu noch vorhält, dass er nicht lesen könne, Unsinn mache und natürlich nur er, Autor B, ein Fachmann sei. Der Sinn von Normdaten liegt nicht darin, dass man leichter 20 Bücher bei der DNB findet, dafür gibt es die Vorlage {{DNB-Portal}}. Während offenbar die meisten Autoren das auf Anhieb verstehen, treten jetzt ein, zwei Autoren aus dem Portal:Physik mit dem Schlachtruf "Wir sind die Fachleute!" auf, die im Grunde behaupten, die Leser seinen zu dumm, um Normdaten zu verstehn und müssten daher vor diesem Wissen und "irreführenden Weblinks" geschützt werden. Mit Physik haben Normdaten aber herzlich wenig zu tun. Das zuständige Fachgebiet fällt in den Bereich der Bibliothekswissenschaft. Fazit: Egal, welche Beispiele man aus den Millionen von Datensätzen raussucht: Dass ein schlecht angelegter oder verlinkter Normdatensatz plötzlich dadurch besser wird, dass man ihn versteckt, wirst du mit keinem von ihnen beweisen können. Nicht umsonst teilen wir seit Jahren (erfolgreich) der DNB Verbesserungsvorschläge über die Liste WP:PND/F mit. Gruß --Kolja21 (Diskussion) 15:52, 4. Jun. 2012 (CEST)
Ich stimme dir nur teilweise zu. Wenn ein Bibliothekswissenschaftler Einwände gegen die Normdaten eines Artikels oder eines Bereichs hat, dann ist das imho ebenso ein KO-Argument wie der Einwand eines Fachwissenschaftlers. Andersherum gesagt: Wenn nur einer von beiden zufrieden ist, dann liegt ein Problem vor.
Und ganz ernsthaft: Wenn der Sinn von (angezeigten) Normdaten nicht darin besteht, dass der Leser dieser anklickt und etwas davon hat - welchen Sinn hat die Anzeige denn dann? Da kann ich derzeit keinen Vorteil erkennen.
Die Seite WP:PND/F kannte ich noch nicht. Sie bezieht sich jedoch nur auf die (in diesem Zusammenhang viel leichter zu wartenden) Personen und hat einen Rückstand von einem dreiviertel Jahr. Ich sehe nicht, wie das im Bereich der Naturwissenschaften (für beide Seiten) machbar wäre, da kann ich mich aber auch irren. Kein Einstein (Diskussion) 17:52, 4. Jun. 2012 (CEST)
Hallo Kein Einstein, wie schon gesagt, sind Normdaten keine Weblinks, auch wenn sie zur Verlinkung genutzt werden können. Wenn jetzt also ein Literaturwissenschaftler kommt und die Normdaten zu Thomas Mann löscht, weil da ein Buch verlinkt ist, dass den von ihm geschätzten Nobelpreisträger völlig missverstanden hat oder, schlimmer noch, ein Buch, dass gar nicht zu dem Thema gehört, geht das an der Sache vorbei. Die Normdaten verknüpfen Namen und Begriffe mit Identifikatoren, damit klar ist, ob sich das Wort "New York" auf das Geografikum New York (Bundesstaat), das Werk New York (Zeitschrift) oder die Person Tiffany Pollard bezieht. Ähnlich wie bei den Interwikilinks lautet die Frage also nicht: Ist der fremdsprachige Artikel fachlich fundiert geschrieben? Sondern: Beziehen sich die Lemmata auf das gleiche Thema, die gleiche Person, den gleichen Ort? Wenn du nur an den auf die {{Normdaten}} klickenden Leser vom 4. Juni 2012 denkst, hast du 95 Prozent des Potentials, das in den Normdaten steckt, ausgeblendet. Gruß --Kolja21 (Diskussion) 18:57, 4. Jun. 2012 (CEST)
Aber das ist genau das Argument, warum es im Bereich der Sachbegriffe, wo derzeit wahrscheinlich ohnehin nur ein paar hundert Artikel mit der Normdaten-Vorlage versehen sind, nicht besonders weh tut, die nicht jedem zu zeigen. Wenn es irgendwann Abertausende sind und entsprechend weiterführende Anwendungen entstanden sein werden, wird der Nutzen einer Anzeige viel deutlicher aufscheinen. Es ist ja auch wirklich so, dass sich Erfahrungen mit der PND nicht zwangsläufig auf die SWD übertragen: Im Vergleich zur "Marke" PND führt die deutlich ältere SWD ein Nischendasein, wurde von nicht so vielen außerbibliothekarischen Projekten aufgegriffen (einzig mir bekannt: Museen überlegten, ob die SWD für ihre Dokumentationszwecke einsetzbar ist) und auch die internationale Vernetzung mit LCSH und Rameau steckt noch in den Anfängen. Wir wissen ohnehin, dass Akzeptanz und Erfolg von der Menge der Verlinkungen beeinflusst sind und hoffen zudem, dass in der Welt von Linked Open Data die Investition in die Erzeugung von Normdaten-Vorlagen in Sachartikeln sich irgendwann genau so auszahlen wird wie die in Personenartikel. In dieser Phase des Versprechens sind wir auf den Goodwill aller Bearbeiter angewiesen. Auf dieser Seite ist also die Frage, ob uns für jedermann sichtbare Normdaten-Boxen in Sachartikeln so viel mehr nutzen als unsichtbare (etwa weil das Interessenten anzieht oder dokumentiert, dass "die Wikipedia" da was tut), so daß wir das zwangsläufige Mehr an Konflikten inkauf nehmen wollen. -- Thomas Berger (Diskussion) 19:47, 4. Jun. 2012 (CEST)
(Nach BK, war an Kolja21 gerichtet:) Du musst mir schon glauben, dass ich dich gerne verstehen will. Aber was ich noch nicht verstanden habe ist: Warum müssen die Normdaten sichtbar sein? Ich habe das Argument der Bevormundung verstanden - das man aber auch verwenden könnte, um WP:WEB auszuhebeln. Und ich sehe natürlich den Vorteil, wenn die angegebene Literatur weiterführend ist. Derzeit ist die Lage im Bereich der Naturwissenschaften aber eher so, dass - um bei deinem Beispiel zu bleiben - die zu Thomas Mann verlinkten Bücher nur manchmal etwas mit ihm zu tun haben, meist aber irgendwelche Zauberberge, Krankheitsepidemien in Venedig, Männer im Allgemeinen und so fort als Thema haben. Und da schaudert es den Thomas-Mann-Fachmann und er fragt, ob solche Verlinkungen sein müssen. Vermutlich aber sollten das Dritte entscheiden, wir kommen einander ja nicht wirklich näher. Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)
Thomas Berger: Ja, so kann man es ausdrücken. Danke für deine vermittelnden Worte (Hier und bei WD:RLP). Kein Einstein (Diskussion) 19:55, 4. Jun. 2012 (CEST)
"die Leser seinen zu dumm, um Normdaten zu verstehn" (Kolja21) – die meisten werden schlau genug sein, nach dem ersten Ausprobieren diese Links zu meiden, aber selbst das bedeutet immense Zeitverschwendung und millionenfaches Kopfschütteln. – Rainald62 (Diskussion) 00:33, 5. Jun. 2012 (CEST)
Entschuldige Dich lieber dafür, dass Du als Auslöser dieser Diskussion ohne Rücksicht auf Vorautoren revertiert hast. Du kennst die Regeln genau, hältst Dich aber nur dann daran, wenn das allgemeine Augenmerk gerade auf Dich und Deine Beitragsliste gerichtet ist. Dein Verhalten bedeutet angesichts der langen Liste von VM´s, Verwarnungen und Sperre die Du (nicht nur von mir) auf dem Kerbholz hast, weit mehr Zeitverschwendung und Kopfschütteln als ein sich noch entwickelndes Projekt der Normdaten. --Carl von Canstein (Diskussion) 07:40, 5. Jun. 2012 (CEST)
+1 und bitte Rainald, unterlass es, mich absichtlich falsch zu zitieren. Für solche Verdrehungen und Unterstellungen sollte man dich sperren. --Kolja21 (Diskussion) 16:03, 5. Jun. 2012 (CEST)
Außerhalb der WP sind Normdaten längst zum Standard geworden, sind neben den bibliografischen Datenbanken unverzichtbare Bestandteile der bibliothekarischen Erschließung. Es ist nicht immer der Weg von der Wikipedia über die Normdaten zu anderen Druckerzeugnissen, es sollte hier auch umgekehrt der Weg von den Druckerzeugnissen dann hin zur Wikipedia betrachtet werden.
Der derzeitige Kampf der Physikredaktion gegen die Normdaten erinnert mich etwas an den früheren Kampf der IEEE gegen die unpraktischen und völlig unverständlichen metrischen SI-Einheiten: man gibt schließlich den Durchmesser eines zölligen Rohres besser in Zoll an. Irgendwann einmal wird jedoch auch das sich erübrigt haben. :-) --≡c.w. 16:51, 5. Jun. 2012 (CEST)

Was wird denn nun mit dem Ausblenden der GNDs in Sachartikeln? (entweder pauschal den Typ SWD ausblenden oder Einzelfallentscheidung per Schalter in der Vorlage) – Rainald62 (Diskussion) 14:54, 5. Jul. 2012 (CEST)

Das Ausblenden der Normdaten ist nicht erwünscht. Gruß --Kolja21 (Diskussion) 21:49, 5. Jul. 2012 (CEST)
Entschuldige bitte, Kolja, aber das ist nicht der Stand der Diskussion. Ich hätte Rainalds Nachfrage gerne anders formuliert gesehen, sehe deine Antwort aber auch nicht als hilfreich an. Kein Einstein (Diskussion) 22:13, 5. Jul. 2012 (CEST)
Ich habe mir die Diskussion nochmal in Gänze zu Gemüte geführt und verstehe die aufgeführten Probleme im Bereich Physik. Andererseits sehe ich auch die Vorteile in vielen anderen Bereichen, die durch die Verknüpfung mit Normdaten entstehen. Ich gehe davon aus, dass mit einer zukünftigen Weiterentwicklung der Bibliothekssysteme die GND viel stärker als bisher als Zugriffsmöglichkeit angeboten wird, sodass nicht nur auf die DNB, sondern auch auf die Bestände naturwissenschaftlicher Bibliotheken zugegriffen werden kann. Kurzum: Ich plädiere dafür, dass die GND-Daten auch im Bereich Physik eingepflegt und angezeigt werden. --Monsieur Becker (Diskussion) 22:40, 5. Jul. 2012 (CEST)
Danke für deinen Kommentar als Dritter. Einpflegen ist ja nicht das Problem. Warum die Anzeige?? Gruß Kein Einstein (Diskussion) 22:48, 5. Jul. 2012 (CEST)
Ich persönlich bin ein großer Befürworter der GND, da sie meines Erachtens bei breiter und konsequenter Nutzung den Zugang zu Wissen verbessert. »Wir« als Wikipedia sind ein Schwergewicht und können der GND zu mehr Bedeutung verhelfen. Das klappt nur, wenn sie auch möglichst vollständig und sichtbar eingebunden wird. So wird es später zum Beispiel attraktiver, eine Physik-Bibliographie zu erarbeiten, die mithilfe der GND inhaltlich gut erschlossen wird. Rückkopplung mit Bibliothekskatalogen nicht ausgeschlossen. Ich weiß, klingt utopisch. Noch. --Monsieur Becker (Diskussion) 23:06, 5. Jul. 2012 (CEST)
Ich kann deinen Gedankengang gut nachvollziehen und hege durchaus Sympathie für ihn. Aber in der Abwägung "Möglicher Gewinn für die (ggf. fernere) Zukunft durch Nutzung des WP-Impacts" vs. "Derzeitiger Nutzen oder eher Schaden für den WP-Leser" komme ich zu einem drastisch anderen Ergebnis: Wir wollen unseren Lesern eine möglichst gute Enzyklopädie bieten, den Einfluss der WP als Mittel zu einem noch so guten Zweck zu nutzen kollidiert imho mit einer unserer Grundsätze: Wie wir keine Theorieetablierung betreiben dürfen, wie wir nicht entscheiden dürfen, was richtiger oder falsch ist, so müssen wir uns auch hier sehr zurückhaltend sein. So "benutzen" wir eher unsere Leser, weil wir es ja besser für sie wissen (klingt recht moralisierend, ist auch so). Kein Einstein (Diskussion) 11:41, 6. Jul. 2012 (CEST)
Ich glaube, ich habe mich ungünstig ausgedrückt: Mein Ansinnen ist es nicht, den »WP-Impact« für die GND auszunutzen, weil sie sonst nur vor sich hindümpelte und ein Schattendasein fristete. Im Gegenteil. Die GND wird heute schon vielfach verwendet, insbesondere jene Datensätze, die aus der PND stammen. Für mich ist es aufgrund der Zusammenführung zu einer gemeinsamen Normdatei nur folgerichtig, dass wir auch die anderen Teile (ehemals SWD und GKD) in die Wikipedia integrieren. Das machen abgesehen von Bibliotheksverbünden vermutlich noch nicht viele, sodass uns zwar eine Vorreiterrolle zukommt, aber nicht in dem Sinne, dass wir den Lesern etwas aufdrücken, um sie zu bevormunden oder zu bemuttern. Bedauerlicherweise hat die GND in einigen Bereichen offenbar (noch) nicht die gewünschte Qualität erreicht. Du leitest daraus einen möglichen Schaden für die Nutzer ab, ich würde in den konkreten Fällen eher von Nichtnutzen sprechen, denn jeder Leser sollte in der Lage sein, die Literaturangaben zu bewerten. Klar, im Normalfall sollte ein Verweis auf die DNB (ähnlich wie bei den Weblinks) einen Mehrwert darstellen, ich halte es in den konkreten Fällen aber für verkraftbar, dass noch kein übermäßiger Nutzen entsteht. --Monsieur Becker (Diskussion) 21:47, 6. Jul. 2012 (CEST)

Hallo Kein Einstein, ich sehe in Rainalds steter Wiederholung der gleichen Forderung kein neues Argument und insofern - wie bei einem LA - auch keinen Grund, die Diskussion wieder von vorne aufzurollen. Gruß --Kolja21 (Diskussion) 22:28, 5. Jul. 2012 (CEST)

Hallo Kolja21. Es ist nicht nur Rainalds Forderung, hier ist sich ein Fachbereich ziemlich einig. Und die alte Diskussion ist leider nicht zu einem Abschluss gebracht worden. Ich sehe Thomas Bergers Vorschlag hier als Brücke, auf die leider nicht reagiert wurde. Daher sehe ich das eben nicht als erledigten Fall. Gruß Kein Einstein (Diskussion) 22:44, 5. Jul. 2012 (CEST)

Hallo Kein Einstein, selbst wenn sich alle Mitarbeiter des Portals Physik einig sind oder wären, liegen seit der letzten Diskussion vor einem Monat mittlerweile konkrete Zahlen vor. Aus der Vorlage:NORMDATENCOUNT geht hervor, dass die GND (einschl. PND) in fast 200.000 Artikeln eingebunden ist. Vom "Typ s" (Sachbegriffe) sind nur 2.312 Artikel betroffen. Selbst wenn jeder zehnte davon zu einem physikalischen Thema wäre, betrifft die Diskussion nur 0,01 Prozent der Artikel. Ausnahmeregelungen zu treffen, ist immer unangenehm, aber in diesem Fall angesichts der Größenordnung imho völlig überflüssig. Gruß --Kolja21 (Diskussion) 01:19, 7. Jul. 2012 (CEST)

Hallo Kolja21. Deine Zahlen kann man selbstverständlich genausogut umdrehen: Wenn es nur um 0,01% aller Artikel geht, dann ist doch eine Ausnahme kein Problem... Dieses Argument ist in meinen Augen sehr schwach. Und ob die anderen Typ s - Einträge sinnvoll sind, wäre zu belegen. Dazu kommt das grundsätzliche Problem, dass dein Argument der „Ausnahmeregelung“ impliziert, dass es eine „Regelung“ gibt - eben wird aber angezweifelt.
Hier kollidieren, wie mir scheint, zwei Prinzipien: Das (sinnvolle) Prinzip, dass die Normdaten-Leute die Normdaten nach ihrem Sachverstand projektweit umsetzen dürfen. Und das (sinnvolle) Prinzip, dass die Fachleute in ihrem Bereich (hier: Die Redaktion Physik) entscheiden können, welche Einträge (Kategorien, Normdaten, whatever) innerhalb ihres Fachbereichs sinnvoll sind und welche nicht. Aus Sicht der RP ist es schon ein gewisses Zugeständnis, die Normdaten-Einträge überhaupt zuzulassen. Ich sehe bei dir bisher nur das Festhalten an der Maximalforderung. Ist kein Kompromiss möglich? Das wäre schade. Gruß Kein Einstein (Diskussion) 22:35, 8. Jul. 2012 (CEST)

Hallo Kein Einstein, es wird niemand gezwungen, die Normdaten für einen Sachartikel einzutragen. Die Ausgangslage war ja folgende: Einige Autoren haben die Normdaten für Physikartikel eingetragen, Rainald hat sie wieder gelöscht, mit dem Argument, es wäre keine brauchbaren Weblinks. Die Normdaten sind ein Angebot. Ob ihr sie nutzt, bleibt euch überlassen. Anders gesagt: Entweder, die Normdaten sind sinnvoll, dann sollte man sie auch anzeigen oder sie sind es nicht, dann braucht man sie nicht unsichtbar zu machen, sondern kann sie einfach weglassen. Für das Portal:Hörfunk, das ich betreue, kann ich nur sagen, dass sie eine große Hilfe sind, da sie bei mehrdeutigen Begriffen eine eindeutige Zuordnung ermöglichen. --Kolja21 (Diskussion) 02:36, 9. Jul. 2012 (CEST)

Meilenstein < 174.000

In der Kategorie »Veraltete Normdaten« gibt es jetzt weniger als 174.000 umstellungsbedürftige Einträge. Einen herzlichen Dank an alle, die fleißig mitmachen. --Monsieur Becker (Diskussion) 07:47, 8. Jun. 2012 (CEST)

Das ist schön, aber diese Kategorie halte ich für keine gute Idee. Eine Wartungskategorie in 170.000 Artikeln, die ja an sich völlig ok sind und nur bei Vorliegen anderer Korrekturen "verbessert" werden sollten, ist kontraproduktiv für das Image der Normdaten insgesamt. Wenn in einem alten Artikel von mir ohne Not plötzlich eine Wartungskategorie für ein kosmetisches Problem erscheint, wäre ich jedenfalls nicht begeistert. Und für die Statistik ist die Kategorie auch unwichtig, denn Vorlage:NORMDATENCOUNT ergibt ja täglich die aktuelle Zahl. --AndreasPraefcke (Diskussion) 09:31, 8. Jun. 2012 (CEST)
Nunja, die Kategorie erscheint ja auch nicht im Artikel, jedenfalls nicht bei Standardeinstellungen. --Mai-Sachme (Diskussion) 11:49, 8. Jun. 2012 (CEST)
Ich halte die Umstellung auf die GND für mehr als eine reine kosmetische Angelegenheit. Auch der Begriff »veraltet« ist meines Erachtens nicht kontraproduktiv, da die PND de facto veraltet ist. Davon abgesehen konnten im Rahmen der Abarbeitung bei vielen Einträgen auch schon VIAF- und LCNN-IDs hinzugefügt werden, sodass die Kategorie aus meiner Sicht ihren Nutzen hat. --Monsieur Becker (Diskussion) 18:34, 8. Jun. 2012 (CEST)
Die Kat schärft das Bewusstsein ... oder sagen wir einfach, ist gute PR für die Umstellungsarbeit. Fröhliches Schaffen! --Kolja21 (Diskussion) 00:38, 9. Jun. 2012 (CEST)

Die Normdaten im Artikel sind nicht veraltet, sowohl das "Datum" selbst als auch die Beschriftung fuer den Leser sind voellig in Ordnung. Das einzige, was veraltet ist, ist der Quelltext der Vorlage. Ich halte es fuer voellig sinnlos, wenn dafuer User auch nur eine Sekunde Lebenszeit aufwenden. Die automatische Ersetzung im Rahmen von anderen Projekten habe ich auch bereits angestossen (zB machta aka das jetzt bei der Rechtschreibverbesserung mit, und ein Skript fuer automatische Quelltextverbesserung macht die Aenderung jetzt auch mit). Die diversen Bots muessen noch dazukommen. Wichtig ist tatsaechlich das Anreichern auch aelterer Artikel mit VIAF und LCCN, wenn die Kategorie also dabei irgendwie hilft: meinetwegen. ----AndreasPraefcke (Diskussion) 07:35, 9. Jun. 2012 (CEST)

Hallo Andreas, wo du von anstoßen sprichst, hast du bei den Botanfragen die Vorlage:PNDfehlt (16.239 Einbindungen) miteinbezogen? Im Grunde könnten wir alle Einträge löschen, bei denen nur ein Parameter (die Datumsangabe) vorliegt, oder? Gruß --Kolja21 (Diskussion) 15:20, 9. Jun. 2012 (CEST)
Wäre es nicht sinnvoller, derartige Verwendungen der Vorlage:PNDfehlt, statt sie ersatzlos zu löschen, auf {{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=|GNDName=|GNDfehlt=|GNDCheck=Datumsangabe im Format JJJJ-MM-TT|REMARK=}} umzuschreiben (vorausgesetzt, dass die Vorlage:Normdaten im Artikel noch nicht eingebunden ist)? Dadurch bleibt die Information erhalten, dass es sich um einen Personenartikel handelt (selbst wenn andere Merkmale eines Personenartikels fehlen sollten, wie etwa die Vorlage:Personendaten oder Personenkategorien) und dass die Eintragung einer GND vom Typ Person erwünscht wäre. --UV (Diskussion) 17:49, 9. Jun. 2012 (CEST)
Davor müsste geprüft werden, ob nicht mittlerweile eine GND vorhanden ist. Durch die Einspielung der regionalen Datensätze Ende 2011 / Anfang 2012 sind die alten Datumsangaben obsolet. Ob es sich um eine Person handelt, die noch keine Normdateneintrag hat, kann man leicht über die Kats Mann/Frau feststellen. Der Auftrag an den Bot eilt aber nicht. Wir können auch erstmal abwarten, wieviele Leute sich an der Abarbeitung der veralteten Vorlage:PNDfehlt beteiligen. --Kolja21 (Diskussion) 18:57, 9. Jun. 2012 (CEST)
Ich könnte mir vorstellen, dass es auch (vereinzelt) Personenartikel gibt, die irgendwie durch die Eingangskontrolle o. ä. durchgerutscht sind, wo sowohl die Vorlage:Personendaten als auch die Kats Mann/Frau und andere Personenkats fehlen und nur z. B. Kategorien wie „Sport (in LAND)“ oder „Wissenschaft (in LAND)“ oder „Politik (in LAND)“ o. ä. gesetzt sind. Zugegebenermaßen wird die Anzahl dieser Fälle nicht allzu hoch sein, aber bei diesen Artikeln könnte dann die Vorlage PNDfehlt das einzige (automatisch auswertbare) Kennzeichen sein, dass es sich bei diesem Artikel um einen Personenartikel handelt. --UV (Diskussion) 19:17, 9. Jun. 2012 (CEST)

Ich habe einmal den Dump 2012-06-03 durchgezählt und es sieht so aus:

  • 10733 Vorlageneinbindungen mit einem Parameter (nur Datum also), davon tragen 1189 eine Vorlage:Normdaten (drei davon mit PND korrigiere ich gleich)
  • 5532 Einbindungen mit zwei Parametern (also mit PND-Nummer eines zu dem gegebenen Datum nichtindividualisierten Satzes), davon 4198 mit Vorlage:Normdaten, davon wiederum 83 mit PND (Spekulation: das sind Fälle Tp existiert, Tn trägt Literatur)
  • 50 Einbindungen mit drei Parametern (Angabe eines abweichenden Namens): (inzwischen umgestellt dank Mai-Sachme und Kolja21)

Ich denke, jede Einbindung von PNDfehlt sollte zumindest in eine Vorlageneinbindung Normdaten|TYP=p umgewandelt werden (sofern noch nicht vorhanden), jeder Parameter #2 in den Parameter GNDname. Das Datum sollte m.E. nach GNDcheck überführt werden (die entsprechenden Monatswartungskategorien wären noch anzulegen), dann sind die 17.000 Pflegefälle etwas auseinandersortiert und es wird weniger frustrierend sie abzuarbeiten. Das Argument von Kolja verstehe ich nicht: Die Datumsangaben dienen doch gerade dazu, Fälle von nachträglichen Verbesserungen in der Normdatei in den Griff zu bekommen: Wenn ich sehe, dass zum Stand 2010-01 kein Tp-Satz existierte, lohnt es sich nachzusehen. Wenn hingegen jetzt durch einen Automatismus 2012-06 eingetragen würde, müsste ich davon ausgehen, dass auch aktuell kein Tp-Satz existiert, weil das diesen Monat jemand überprüft hat... -- Thomas Berger (Diskussion) 22:21, 9. Jun. 2012 (CEST)

Natürlich ist die Datumsangabe hilfreich - bei der neuen Vorlage:Normdaten. Bei dem PNDfehlt-Hinweis ist es dagegen schnuppe, ob die letzte Überprüfung 2008 oder 2010 stattgefunden hat, da 2011/2012 die regionalen Bibliotheksverbünde mit aufgenommen wurden und damit eine Flut neuer GND-Datensätze angelegt wurde. --Kolja21 (Diskussion) 20:08, 10. Jun. 2012 (CEST)
Der GNDCheck-Parameter in der Normdaten-Vorlage ist doch genau aus dem Grund eingeführt worden, die Funktion des Datumsparameters aus PNDfehlt zu übernehmen! Also können auch die Daten existierender PNDfehlt-Einbindungen in die Normdaten-Vorlage überführt werden. Aus Sicht eines Einzeldatensatzes ist es auch egal, ob seit der letzten Kontrolle 300 oder 3.000.000 Sätze neu in die Normdatei aufgenommen wurden, was zählt ist, ob zu dieser Person oder nicht... Andersherum gedacht: Welches Datum würdest Du denn als GNDCheck eintragen, wenn per Bot die PNDfehlt's aufgelöst werden? -- Thomas Berger (Diskussion) 22:51, 10. Jun. 2012 (CEST)
Das ist eine Fangfrage ;) Ich halte die alte PNDfehlt-Vorlage (mit nur einem Parameter) ja eher für überflüssig, aber wenn sich genug Leute finden, die sich der Arbeit annehmen wollen, bin ich der letzte, der sie boykottieren würde. --Kolja21 (Diskussion) 00:49, 11. Jun. 2012 (CEST)
Lass' uns das mal differenzieren: Zu 10.000 PNFfehlt "nur mit Datum" sind zwischenzeitlich knapp 3.000.000 Tn-Sätze in der PND hinzugekommen. Die Chance ist tatsächlich gross, dass der Name inzwischen in der GND vorkommt, aber kaum verändert im Hinblick auf "meldbare" Tn's, also solchen mit Literatur in der DNB. Allerdings sind - und das betrifft auch die 5.000 PNDfehlt mit Tn-Angabe - aus den Masseneinspielungen ein paar Zigtausend Tp hinzugekommen, das tritt m.E. aber nicht sonderlich hervor, denn von 2007 (so alt sind die Daten in PNDfehlt manchmal) bis 2012 ist auch "regulär" eine enorme Zahl von Tp-Sätzen angelegt worden. Ich denke jedoch, dass Neuprüfung eines vor fünf Jahren mit PNDfehlt versehenen Artikel in sehr vielen Fällen immer noch dasselbe Ergebnis bringt, wohingegen ein noch nie geprüfter Artikel deutlich häufiger einen Treffer haben wird. Die Crux ist natürlich, dass wir nie wissen, wie alt der Datumsstempel sein muss, damit sich eine - evtl. sogar systematische - erneute Prüfung lohnt (nur dass ein fünf Jahre nicht geprüfter Satz evtl. lohnender ist als ein zwei Jahre nicht geprüfter, vorausgesetzt die Personen sind aufgrund nicht scharf formulierbarer Kriterien genügend vergleichbar). Die Alternative zur 1:1-Überführung der Daten aus PNDfehlt in die Normdaten-Vorlage ist eigentlich nur das komplette Verwerfen von PNDfehlt, wie Du es ja auch vorzuschlagen scheinst, das würde aber bedeuten, die Artikel auf "noch nie geprüft" heraufzustufen: Bevorzugte, angebliche Erst-Prüfung wäre dann angebracht, was für die 17.000 fraglichen Artikel locker 2.000h Arbeit sind, die wir bei Erhaltung der Zeitstempel leichter in die Zukunft schieben könnten. -- Thomas Berger (Diskussion) 01:54, 11. Jun. 2012 (CEST)

Überprüfung der VIAF-Einträge auf Zusammenführung

Beim it. Schauspieler Stefano Accorsi war ursprünglich die VIAF-ID 103292496 eingetragen. Diese wird nun automatisch auf 19917790 weitergeleitet. Ich gehe stark davon aus, dass hier mehrere Datensätze zusammengeführt wurden. Da eine regelmäßige manuelle Überprüfung kaum durchführbar ist, wollte ich fragen, ob es Möglichkeiten gibt, die VIAF-IDs monatlich oder vierteljährlich auf solche Zusammenführungen hin zu überprüfen. -- Monsieur Becker (Diskussion) 19:19, 14. Jun. 2012 (CEST)

Bei PNDs habe ich das mal gemacht, bei den VIAF-Nummern hatte ich das auch angedacht. Wie so oft ist das aber eine Frage der Zeit. Mit allem, was ich so geplant habe im Bereich Personendaten/Normdaten könnte ich vermutlich vollzeit den Rest meines Lebens dran arbeiten ;) --APPER\☺☹ 20:40, 14. Jun. 2012 (CEST)

Eine monatliche Überprüfung wäre übertrieben, da die VIAF-Datenbank selbst nur alle ein, zwei Monate aktualisiert wird. Am wichtigsten sind die "Ur-"Normdatensätze GND, LCCN und NDL. Darauf sollten wir uns konzentrieren. Die Sammelnormdaten VIAF sind nur ein Zusatzangebot. Gruß --Kolja21 (Diskussion) 23:39, 14. Jun. 2012 (CEST)

Dubletten: SWD und GKD

Durch Zusammenfallen von SWD und GKD (das schien für geografische Objekte bis dato funktional unterschieden worden zu sein in "Thema in Literatu" und "beteiligt an/Urheber von Literatur") scheint es jetzt mehrfache GNDs für geografische Körperschaften zu geben, so zum Beispiel http://d-nb.info/gnd/2015398-3 und http://d-nb.info/gnd/4030481-4 für Kiel. Was tun? --Widerborst 11:22, 17. Jun. 2012 (CEST)

Abwarten und Tee trinken ;) Nach der Umstellung auf die GND (incl. Schulung etc.) nehmen die Bibliotheken jetzt erst langsam wieder die Arbeit auf, und dann sind auch schon Sommerferien. Bis die Dubletten zusammengeführt sind, werden also noch ein paar Monate vergehen. Zzt. gibt es für uns zwei Möglichkeiten: Fall 1: Einer der beiden Normeinträge enthält deutlich weniger Informationen und keine Verknüpfungen auf Werke, dann kann er wegfallen. Fall 2: Beide Normeinträge sind wichtig, dann sollte man SWD und GKD stehen lassen bzw. eine GND eintragen und die zweite GND im Feld "REMARK" vermerken. --Kolja21 (Diskussion) 15:16, 17. Jun. 2012 (CEST)

Das sieht bei Kiel dann z.B. so aus:

{{Normdaten|TYP=g|GND=2015398-3|GNDCheck={{subst:NormdatenDatum}}
 |REMARK=Dublette GND 4030481-4 vorhanden.}}

Dadurch landet der Artikel in der Wartungskat Kategorie:Wikipedia:GND fehlt 2012-06, obwohl die GND natürlich in diesem Fall nicht fehlt, sondern nur in ein paar Monaten überprüft werden soll. --Kolja21 (Diskussion) 15:28, 17. Jun. 2012 (CEST)

Zu nach GND-Start redundanten Datensätzen ist eine Ankündigung aus dem Newsletter "Standardisierung" Nr. 19 interessant (PDF-Ausgaben hier): »Ebenso wurde ein weiterer Termin für das sog. Match-und Merge-Verfahren abgestimmt, das erst zehn Wochen nach dem Umstiegstermin am 19. April 2012 starten kann, um den Verbünden genügend Zeit zum Überspielen der GND-Daten in die Lokalsysteme zu lassen. In diesem Verfahren sollen bereits als dublett erkannte Sätze aus der GKD und SWD, die dieselben Entitäten beschreiben, maschinell zusammengeführt werden.« – 19. April + 10 Wochen = 28. Juni als frühester Starttermin. Keine Ahnung, wann erste Ergebnisse dieser Zusammenführung sichtbar werden könnten. -- Make (Diskussion) 15:54, 17. Jun. 2012 (CEST)

Danke für die kompetenten Antworten. Dann harrenwermal. --Widerborst 18:13, 17. Jun. 2012 (CEST)

Ich hatte mich bezüglich zweier Datensätze für den Eurovision Song Contest 2004 (4792884-0 und 10335908-4) an die DNB gewandt und bekam folgende Antwort: »der ehemalige GKD-Satz wird bei Körperschaften und Kongressen gewinnen. Im vorliegenden Fall erkennt man es daran, dass keine Systematiknummer vorhanden sein darf (bei 4792884-0 Systematik 14.1 Musik (Allgemeines), Musikgeschichte - also Looser). Bei Geografica gewinnt der SWD-Satz (üblicherweise mit DDC-Notation versehen).« Bezogen auf Kiel müsste also 4030481-4 das Rennen machen. --Monsieur Becker (Diskussion) 07:28, 18. Jun. 2012 (CEST)

Sehr interessant, danke. Aber vielleicht warten wir wirklich am besten noch die paar Wochen, bevor wir uns unnötig Arbeit machen. --AndreasPraefcke (Diskussion) 09:41, 18. Jun. 2012 (CEST)

Noch eine Arbeitsliste

Wer einfache Erfolgserlebnisse sucht, findet unter Benutzer:Gymel/VIAF-Zuordnungen eine Liste von Artikeln, die zum Stichtag 3. Juni 2012 gar keine Normdaten (oder PNDfehlt-Einträge) hatten, denen jedoch aus VIAF (über Umweg en:WP und Interwiki-Links) eine GND-Nummer zugeordnet werden kann (oder dennoch nicht: Die Qualität hängt von der Güte der VIAF-Automatismen ab). Diese Liste dürfte komplementär zu APPERs Liste im vorigen Abschnitt sein (denn wenn ein Artikel keine Normdaten-Vorlage trägt, kann er auch keine VIAF-Nummer direkt ausspucken). -- Thomas Berger (Diskussion) 02:23, 25. Jun. 2012 (CEST)

Danke, schau gleich mal rein. Durchnummerierte Liste abzuarbeiten, ist motivierender als Kats mit über 10.000 Einträgen, obwohl die neue mit 6.924 Artikel auch nicht gerade kurz ist. BTW: Ich hatte dich, glaube ich, schon mal gefragt. Ist es aufwändig, eine aktualisierte Liste Parameterhäufigkeit in de:WP zu erstellen? Ich bin neugierig, was sich im Hinblick auf Parameter wie "SELIBR", "WP" etc. seit Anfang Mai getan hat. Aus dem Dump, den ich mir gezogen habe, werde ich nicht schlau. Gruß --Kolja21 (Diskussion) 02:34, 25. Jun. 2012 (CEST)
Der Dump ist schon drei Wochen alt, bereinigt um zwischenzeitlich schon bereinigtes (Benutzer:APPER war gestern wohl fleißig) sieht es wie folgt aus (Stand 3. Juni 2012):
 BNE       :      1
 BNF       :     43
 EST       :     58
 GKD       :   6015
 GKD-V1    :    486
 GKD-V2    :     60
 GND       :   6790
 GNDCheck  :   2500
 GNDName   :   1659
 GNDfehlt  :   1478
 IPI       :      1
 LCCN      : 114531
 NDL       :   1776
 PND       : 174658
 REMARK    :    480
 SELIBR    :   2478
 SWD       :   7197
 TYP       :   9964
 VIAF      : 139809
 WORLDCATID:     16
 WP        :    311
 typ       :     48
Für den Juli-Dump gibt es dann wieder eine Auswertung unter eigener Überchrift, hoffentlich ist das mit "typ" nicht eingerissen, da es aber überwiegend Personenartikel mit altem "PND"-Parameter sind, ist es derzeit harmloser Schmutz, aber dennoch unschön...
Artikel mit "Typ" oder "typ" sind jetzt auch unter Kategorie:Wikipedia:Normdaten-Typ falsch eingetragen eingetragen. Hab gerade schon zwei gefixt. --AndreasPraefcke (Diskussion) 19:41, 25. Jun. 2012 (CEST)

Hast du eine Präferenz, wie wir die abgearbeiteten Artikel markieren/löschen sollen? Nach meiner Löschung stimmt die Kapitelzählung nicht mehr. --Mai-Sachme (Diskussion) 21:35, 25. Jun. 2012 (CEST)

Die Überschriften sollten nicht geändert werden, höchstens gelöscht, wenn ein Abschnitt ganz leer geworden ist. Die Binnennummerierung in den einzelnen Abschnitten hilft vielleicht beim Abzählen, wenn man sich mehrere Artikel gleichzeitig in Browser-Tabs lädt (ich selber arbeite eher in 10er- oder 20er-Portionen, 50er wären mir viel zu umfangreich). Die Hoffnung ist, dass sich die Bearbeitermassen schön gleichmässig auf die verschiedenen Abschnitte verteilen, so dass es keine BK's gibt. Es ist genug für alle da, derzeit sehe ich kein Problem darin, großzügig auch das zu löschen, was zu knifflig zu lösen oder zu mühsam zu melden ist oder einen ganzen Abschnitt zu löschen, wenn man bei seinen Bearbeitungen den Überblick verloren haben sollte: Spätestens wenn der nächste VIAF-Komplettabzug aufliegt werde ich die Liste mit aktuellen Daten komplett neu generieren und danach werden alle Nummern geändert sein, alle anderweitig erledigten verschwunden und alle unbearbeitet gestrichenen wieder da. Bitte "Bescheid", wenn die Liste dann besser mit fixen Eintragsnummern generiert werden sollte. -- Thomas Berger (Diskussion) 22:26, 25. Jun. 2012 (CEST)

Wow, tolle Liste! Man man... also dass wir irgendwann die Artikel voller Normdaten haben ist wohl unwahrscheinlich ;). Zur Parameterliste: ich habe ja jetzt den MMP-Account "authoritycontrol" auf dem Toolserver und eines der ersten Projekte dort ist ein Neuschreiben der Auswertung der Normdaten. In diesem Zusammenhang wird es demnächst möglich sein, Listen aller Parameter der Normdatenvorlage (wie hier grade geschehen) halbwegs aktuell auszugeben. Das ganze ist noch nicht fertig, aber ich habe schonmal ein paar Fälle gefunden und korrigiert, deshalb war ich fleißig ;). --APPER\☺☹ 00:50, 26. Jun. 2012 (CEST)

+1. Klingt alles sehr motivierend. Danke Andreas für den Update! @APPER: Wird die Liste dann auch die Anzahl der GNDs nach TYP getrennt ausgeben? --Kolja21 (Diskussion) 03:46, 26. Jun. 2012 (CEST)
Ja. Der TYP wird sogar in der alten Version jetzt schon miterfasst - dann werde ich aber Vorlage:NORMDATENCOUNT entsprechend anpassen, dass auch diese Daten immer aktuell zur Verfügung stehen. --APPER\☺☹ 11:42, 26. Jun. 2012 (CEST)

Parameterhäufigkeit in de:WP (2012-06-30)

Der dewiki-Dump 20120630 enthält 225.467 Verwendungen der Vorlage:Normdaten, dabei sind die einzelnen Parameter wie folgt verteilt: -- Thomas Berger (Diskussion) 20:44, 1. Jul. 2012 (CEST)

BNF       :     42
EST       :      1
GKD       :   3488
GKD-V1    :    384
GKD-V2    :     29
GND       :  25849
GNDCheck  :   7017
GNDName   :   4164
GNDfehlt  :   5130
IPI       :      1
LCCN      : 118467
NDL       :   2585
PND       : 166779
PNDCheck  :      1
PNDfehlt  :      1
REMARK    :    603
SELIBR    :   2357
SWD       :   3671
TSURL     :      1
TYP       :  34910
VIAF      : 146831
WP        :    233

Super, danke! Zwei Artikel mit Tippfehlern (PNDCheck und PNDfehlt) habe ich schon korrigiert. --Kolja21 (Diskussion) 21:34, 1. Jul. 2012 (CEST)

Hallo Freunde der Normdaten-Vorlage. Ab sofort wird automatisiert täglich eine Liste der fehlerhaften Normdaten-Vorlagen-Parameter angelegt. Ihr findet diese unter http://toolserver.org/~authoritycontrol/service/dewiki_normdatenparameter.txt - diese Liste wird um 8 Uhr UTC (also im Sommer 10 Uhr unserer Zeit) aktualisiert. Die aktuelle Ausschlussliste enthält alle Parameter die in der Liste hier mehr als 10 Mal vorkommen. Wenn von "Parameter 1" die Rede ist, dann sind unbenannte Parameter gemeint, also beispielsweise {{Normdaten|PND...}} oder {{Normdaten|...|1234}}. Damit sollte die "Normdatenhygiene" jetzt wohl zunehmen *g*. --APPER\☺☹ 02:27, 7. Jul. 2012 (CEST)

Gute Tippfehlersammlung! Die 9 Einträge von heute habe ich abgearbeitet. --Kolja21 (Diskussion) 02:55, 7. Jul. 2012 (CEST)

PS: Wenn ich dich richtig verstehe, erfasst die Liste allerdings nicht veraltete oder ungültige Parameter wie "EST", "IPI", "PNDCheck", "WP" etc.? --Kolja21 (Diskussion) 03:05, 7. Jul. 2012 (CEST)
Genau. Die Ausnahmeliste sieht wie folgt aus: 'PND', 'GND', 'BNF', 'GKD', 'GKD-V1', 'GKD-V2', 'GNDCheck', 'GNDName', 'GNDfehlt', 'LCCN', 'NDL', 'REMARK', 'SELIBR', 'SWD', 'TYP', 'VIAF', 'WP'. Ich kann gerne auch Listen für andere Parameter liefern, wenn ihr die abarbeiten wollt, beispielsweise BNF oder GKD-V1/V2. Bei dieser konkreten Liste ging es jetzt aber erstmal darum, dass nicht noch weitere Typen dazukommen ;) --APPER\☺☹ 14:19, 7. Jul. 2012 (CEST)
Danke, jetzt habe ich es verstanden. "EST", "IPI", "PNDCheck" würde also automatisch als Fehler gemeldet. Mit der Abarbeitung von GKD-V1/V2 hat es noch Zeit; erst mal soll die DNB in Ruhe ihre halbautomatische Dublettenbereinigung durchziehen. Bei dem Parameter "WP" würde ich mich allerdings gerne an der Abarbeitung beteiligen, sprich eine Liste wäre hilfreich. Wer über diese Abk. stolpert, wird unnötig irritiert, denn in der Dokumentation zur Normdatenvorlage, Abschnitt "Veraltete Parameter" kommt sie nicht vor. Gruß --Kolja21 (Diskussion) 19:09, 7. Jul. 2012 (CEST)

Nicht individualisierte GNDs

Zur Zeit klagen wir ja nicht über mangelnde Arbeit, trotzdem wollte ich mich hier erkundsigen, ob und wie eine Initiative gegen einen meiner Meinung nach unschönen Zustand möglich und erwünscht ist. Mit erstaunlicher Häufigkeit stoße ich auf nicht individualisierte Einträge, die in Personenartikel als reguläre PNDs/GNDs vermerkt sind (im Normalfall nicht von den regulars hier eingetragen, aber man freut sich ja, dass auch andere ein bisschen was in die Richtung machen). Offenbar war eine automatisierte Erkennung derselben bisher nicht ganz trivial, aber eventuell hat sich das ja geändert, seit auf viaf.org nicht individualisierte Einträge als (undifferentiated) markiert werden. Deshalb meine Frage: Ist es mit vertretbarem Aufwand möglich, die nicht individualisierten Einträge in der Normdaten-Vorlage aufzuspüren? Und lohnt sich eurer Meinung nach der Aufwand? --Mai-Sachme (Diskussion) 14:30, 6. Jul. 2012 (CEST)

Ich habe mich noch nicht darum gekümmert das nachzuprüfen, aber angekündigt war, dass die GND seit 1. Juli unter einer neuen Lizenz (CC0) steht. Damit ist uns auch ohne individuelle Vereinbarung erlaubt, Daten direkt zu uebernehmen (z.B. den Typ automatisiert eintragen zu lassen) oder den Gesamtdatenbestand auszuwerten, beispielsweise einen WP-Monatsdump gegen einen GND-Komplettabzug auszuwerten und Abweichungen des Typs als Wartungsliste festzuhalten. Oder etwas komplizierteres irgendwie in der Mitte ablaufen zu lassen, etwa einen Wartungsbot, der in geänderten Artikeln die Konsistenz der eingetragenen Normdaten überprüft (Typ, Tn/Tp, ob die Nummer noch gültig ist etc.). Mit der neuen Lizenz können wir uns solche Werkzeuge nicht nur ausdenken, sondern sie auch tatsächlich implementieren. -- Thomas Berger (Diskussion) 15:23, 6. Jul. 2012 (CEST)

Hallo Mai-Sachme, das Problem ist bekannt. Eine Zählung im Februar 2010 ergab, dass damals 5.000 Tn-Datensätze (fälschlicher Weise) per PND-Vorlage eingebunden waren. Mittlerweile kennzeichnet VIAF nicht-individualisierte Datensätze und Neueinträge kommen zum Glück seltener vor. Gruß --Kolja21 (Diskussion) 01:37, 7. Jul. 2012 (CEST)

Zitat von http://www.dnb.de/DE/Service/DigitaleDienste/LinkedData/linkeddata_node.html Für die Gemeinsame Normdatei (GND) und die Titeldaten des Linked-Data-Services gilt ab sofort die Nutzungslizenz Creative Commons Zero. --AndreasPraefcke (Diskussion) 18:54, 7. Jul. 2012 (CEST)

Bestimmte Tests konnten wir auch ohne CC0 machen - vor allem wenn es darum ging, schon in der WP vorhandene PNDs zu checken, dazu hatte ich zumindest das informelle okay der DNB. Also dass bestimmte Tests (z.B. auf Tn) nicht gelaufen sind, liegt meinerseits eher an fehlender Zeit als an fehlenden Lizenzen. Was bringt es uns auch, eine Liste der genutzten Tns zu haben? Ja, dann können wir die 5000 Artikel bearbeiten und aus GND= GNDName= machen, aber die eigentliche Arbeit wäre, diese GNDs alle anzugucken, zu prüfen, welche Literatur zur korrekten Person gehört und die zu melden: aber beim aktuellen Rückstand von WP:PND/F würde eine Meldung von 5000 Nummern wohl eher nicht viel bringen. Solange wir soviel Arbeit haben (z.B. die GND-VIAF-Liste) stören mich die Tns nicht sonderlich. Also früher oder später werde ich wieder entsprechende Tests laufen lassen (hatte ich vor einigen Jahren schonmal), aber in den nächsten Wochen werd ich sicher nicht dazu kommen: Also wenn jemand anders will, gerne ;) --APPER\☺☹ 19:10, 7. Jul. 2012 (CEST)

So: entgegen meiner obigen Aussage, dass ich in den nächsten Wochen nicht dazu komme, habe ich jetzt mal einen Testlauf angeworfen, wird sicher ein bissl brauchen (betrifft nur Personenartikel). Dafür checke ich auch ein paar andere Sachen. Rauskommen werden wohl fünf Wartungslisten. Je nach Länge werde ich die selbst bearbeiten oder hier irgendwo posten werde:

  1. völlig falsche GND
  2. fehlerhaftes Geschlecht (anscheinend zu 99% Fehler bei der DNB)
  3. kein Tp-Datensatz (das ist die geforderte Tn-Liste)
  4. geringe Ähnlichkeit WP-Datensatz <-> GND-Datensatz
  5. Weiterleitung: bei uns ist eine GND angegeben, die inzwischen auf eine andere weiterleitet

Die Listen 1 und 2 werden nur wenige Einträge haben, Liste 3 wird die längste, gefolgt von 4 und 5. Zur Liste 4: Hier berechne ich einen Ähnlichkeits-Score, in den Name, Geschlecht und Lebensdaten einfließen - und unterhalb einer gewissen Ähnlichkeit landet ein Eintrag auf der Liste. Bei zwei zufällig angeschauten Datensätzen waren auch das Schreibfehler bei der DNB (bei den Lebensdaten), aber auf dieser Liste werden natürlich auch viele Fehleinträge sein. Noch dauerts, die erste Liste (Liste 3) werde ich dann demnächst mal bereitstellen.

Wie soll denn das Vorgehen sein? Also was machen wir mir Artikeln, in die eine Tn-GND eingebunden ist? Wenn wir plötzlich tausende Einträge der DNB melden, dann kommt doch nie eine Rückmeldung... irgendwie macht mich die Meldesituation derzeit unzufrieden :/ --APPER\☺☹ 13:49, 9. Jul. 2012 (CEST)

Die Tn-Liste komplett an die DNB schicken und sie um ein passables Meldeverfahren bitten. Irgendwie müssen sie sich was einfallen lassen: Entweder sie stellen jemand zur Bearbeitung unserer Rückmeldungen ab oder wir bekommen ein eingeschränktes Zugriffsrecht. Es gibt ja bereits im Normdatensatz die Position 4, die die Erfassungsqualität kennzeichnet. (1 = Verbundredaktion; 2 = lokalte Red.; 3 = geschultes Personal ...) Insofern sollte es technisch kein Problem sein, Wikipediaautoren stärker einzubinden. --Kolja21 (Diskussion) 16:03, 9. Jul. 2012 (CEST)
Hilft beides (hier) nicht: M.E. ist da eine Person mit festem Stundenkontingent (5 oder 10h wöchentlich?) für die Bearbeitung "unserer" Meldungen abgestellt. Wir sollten davon ausgehen, dass die Bearbeitung unserer Meldungen normalerweise länger dauert als unser Melden, obwohl das bereits ziemlich zeitverschlingend sein kann, wenn es sorgfältig gemacht wird. Und das Level "6", das uns als unqualifiziertem, bibliotheksfremdem Personal zugeteilt werden würde (so wie auch Museen und Archiven: Selbst Besitz von Originaldokumenten oder anderen Formen "besseren" Wissens gibt keine Pluspunkte in der Redaktionshierarchie), würde uns die Anlage von Neusätzen und evtl. das Ergänzen von Todesdaten erlauben, aber beim Aufräumen des Vorhandenen Sumpfs keine Vorteile bringen. Da hilft eigentlich nur "delegieren": Statt dass ein Einzelkämpfer einige Meldungen pro Stunde komplett bearbeitet, könnte er auch einige Dutzend pro Stunde auf die "zuständigen" Sub-Redaktionen verteilen ... -- Thomas Berger (Diskussion) 18:45, 9. Jul. 2012 (CEST)
@APPER ("Was machen wir"): Zunächst gefragt: "Was bedeutet das eigentlich?". Mein Eindruck nach der Begegnung mit allerhand Pseudoindividualisierten Tp's und wunderbar eindeutigen Tn's ist folgender: Die Deklaration als Tn oder Tp ist auch nur ein Anhaltspunkt unter mehreren, wenn es um "Personalisierung" geht. Mindestens genauso stark ins Gewicht fällt die tatsächliche Nutzung in Bibliotheksverbünden und anderswo: Wenn ein Tp im Feld für alles Mögliche benutzt wird, taugt er wenig und alle müssen aufräumen, evtl. gibt der Original-GND-Datensatz schwache Hinweise auf "das was gemeint ist" und damit Anhaltspunkte dafür, was in welche Richtung zu schaufeln ist. Wird umgekehrt ein Tn in diversen Anwendungen nur für eine einzige Person genutzt, dann ist das nur insofern defizitär, dass man vielleicht Lebensdaten ergänzen kann. Das VIAF-Matching z.B. ist ja auch ganz stark "evidenzbasiert" und versucht sich nicht primär an Linguistik bezüglich Ansetzungen oder Arithmetik der Lebensdaten. Problematisch wird die Situation "guter" Tn eigentlich erst im Zusammenhang mit Dubletten innerhalb der GND.
Wir könnten nach einem Abgleich erkannte Tn's zwanglos von GND nach GNDName bringen mit aktuellem Datumsstempel GNDCheck. In einigen Jahren, wenn wir mit den Altlasten durch sind, kommen die auf "Wiedervorlage" und jemand schaut intellektuell nach, ob es nicht einen Tp dazu gibt. Zwischenzeitlich können ja immer wieder Umlenkungen (der GND-Term für die "Weiterleitungen" in Liste 5) verarbeitet werden, die das Problem manchmal von alleine lösen (GNDName wird zu GND). Für Exporte und Verarbeitungen (Personensuche, DNB-Export) sollte - je nach Nutzungszweck - GNDName für fehlende GND-Parameter einspringen bzw. sogar beides exportiert werden. Voraussetzung ist allerdings etwas Disziplin hier: GNDName sollte dann wirklich nicht belegt werden, wenn in der GND nur ein Namenssatz ohne irgendwo nachweisbare Literatur oder mit ausschliesslich andere Personen betreffende Literatur gelistet ist. D.h. auch Tn's können glattweg unzutreffend sein, selbst wenn es keinen Tp gibt und die Person so und so heißt. -- Thomas Berger (Diskussion) 18:45, 9. Jul. 2012 (CEST)
Verknüpfte Tns ohne Literatur halte ich tatsächlich für extremst überflüssig. Gibt es Gründe dagegen, diese zu entfernen? Dann würde ich die Liste 3 nochmal nachsortieren (insgesamt übrigens 4127 Einträge derzeit). Aber wie siehts mit solchen Fällen aus: Tn 101670826. Erstmal nur Name, wenn man aber den genauen Datensatz anschaut, gibt es einen Hinweis auf Mirambel, André: Etude descriptive du parler maniote méridional. - 1929. Was macht sowas überhaupt in einem Tn-Satz... das ist wohl die Art Quasi-Tp-Sätze von denen du gesprochen hast... Schwierig. --APPER\☺☹ 00:33, 10. Jul. 2012 (CEST)
Ich habe auch schon Tn mit Verweis vom Geburtsnamen gesehen... Und bei Personen ohne Literatur in der DNB findet man oft über die WP-Personensuche heraus, dass alle Bibliotheksverbünde damit dieselben, für die Person einschlägigen Titel verknüpfen, in solchen Fällen trage ich das auch als GNDName ein und mache sogar eine Meldung auf WP:PND/F (mit Hinweis auf die Verbünde). Ich meinte eher Fälle wie Hans Schwenke, wo ich mir heute abend einen Wolf gesucht habe: Anscheinend wurde der Tn-Treffer in der DNB nicht nur im Artikel (als Vorlage:DNB-Portal, ein anderer Bearbeiter war bei den Vorlage:Normdaten vorsichtiger...) eingetragen sondern sogar zum Anlass genommen, den Artikel zu einem Bürgerrechtler mit numismatischen Publikationen anzureichern. Daher wäre ich auch extrem vorsichtig beim automatischen Melden von Tn's, denn auch das Helferlein normdaten.js verleitet für meinen Geschmack etwas zu leichtfertig zum Eintrag unzutreffender Tn's. -- Thomas Berger (Diskussion) 00:46, 10. Jul. 2012 (CEST)
Das Problem stellt sich bei Amazon viel eher. Es gibt leider immer wieder Autoren, die wahllos einen Namen ergooglen und die Treffer dann als Werke des Gesuchten eintragen. Hans Schwenke war übrigens nicht nur Bürgerrechtler - davon kann man ja nicht leben ;) -, sondern auch Fotograf. Der Tn kann ihm zugeordnet werden, da er zwar kein Numismatiker ist, aber die Münzen abgelichtet hat. (Ich korrektiere den Artikel gleich mal.) --Kolja21 (Diskussion) 05:10, 10. Jul. 2012 (CEST)

Ich verknüpfe Tn ohne Literatur wenn

  1. die AKS-Auswertung im B3Kat (oft) oder in anderen Verbünden (selten) ein eindeutiges Ergebnis mit passender Literatur zu der Person bietet
  2. selten auch wenn, der Name sehr, sehr eindeutig ist (gerade bei sehr ungewöhnlichen Namen oder den beliebten Doppelnamen a la Sabine Leutheusser-Schnarrenberger)

--AndreasPraefcke (Diskussion) 11:31, 10. Jul. 2012 (CEST)

Also: wie ist der Konsens? Die DNB kann mit sovielen Einträgen nichts anfangen, zumal die Qualität bei uns unterschiedlich ist. Soll ich die Liste (oder einen Auszug daraus?) hier trotzdem irgendwo online stellen oder gibt es da nichts abzuarbeiten? --APPER\☺☹ 14:49, 10. Jul. 2012 (CEST)

Also da ich ja hier die Anfrage gestellt habe, würde ich so eine Liste tatsächlich für wünschenswert halten. Die Einzelfälle sind ja sehr unterschiedlich geartet, teilweise sind das Fälle für eine Sofort-Meldung, teilweise leere Namenseinträge, teilweise einfach irgendwas Falsches, wo man sich fragt, wie genau das passiert ist. Ich habe erst kürzlich einen Fall entdeckt, wo statt einer bestehenden Tp mit x Literatureinträgen ein leerer Tn-Namenseintrag verzeichnet war. --Mai-Sachme (Diskussion) 16:32, 10. Jul. 2012 (CEST)
Keine Entschuldigung, aber ein Erklärungsversuch: Das kommt evtl. daher, dass das Schnark-Skript den korrekten VIAF-Eintrag auswertet, dieser VIAF-Eintrag aber aus diversen Gründen einen in der DNB "leeren" (aber in Verbünden sehr vollen) Namenseintrag ausgibt, weil die Titel sehr gut mit z. B. der LOC übereinstimmen; während ein gefüllter individualisierter Satz aufgrund einer anderen Namensansetzung, anderen Lebensdatenansetzungen o. ä. dann unberücksichtigt blieb. Wenn man dann dem Skript vertraut und _nicht_ nachschaut, ob das Skript auch einen anderen Satz anbietet (oder nicht selbst einfach nochmal eine Suche bei der DNB startet), dann kommt so etwas zustande. --AndreasPraefcke (Diskussion) 21:40, 17. Jul. 2012 (CEST)
Unter Benutzer:APPER/Tn findest du jetzt knapp über 1000 der 4127 Einträge. --APPER\☺☹ 20:23, 17. Jul. 2012 (CEST)
Super! Da ich in meiner Anfangszeit aus Unwissenheit auch nicht-individualisierte Einträge in die Normdaten übernommen habe, werde ich bei der Abarbeitung dieser Liste helfen :-) Besten Dank APPER. Silke (Diskussion) 20:59, 17. Jul. 2012 (CEST)
Danke, ich werde mir das mal nach und nach anschaun. --Mai-Sachme (Diskussion) 21:36, 17. Jul. 2012 (CEST)
Sehr gut, danke APPER. --AndreasPraefcke (Diskussion) 21:40, 17. Jul. 2012 (CEST)

Gegen eine automatisierte Löschung der bei der DNB "leeren" Tn unter GNDName bin ich strikt. Ich habe hunderte eingefügt, alle nach Prüfung im B3Kat. Wenn diese Arbeit jetzt zunichte gemacht wird, würde mich das ärgern. Die GND ist NICHT eine Angelegenheit nur der DNB. Diese schlechteste aller deutschen Bibliotheken (von der Stabi Berlin vielleicht abgesehen) ist eher zufällig für uns mit der GND verknüpft, weil sie nunmal die Redaktion bereitstellt und daher die GND-Website mit den DNB-Sätzen verknüpft ist. Wenn sie das nicht wäre, wäre die GND für uns genauso wertvoll. Die DNB-Treffer sind oft naturgemäß wenige (das ist ja keine Nationalbibliothek, die heißt nur so, wenn schon per Definition alles vor 1913 fehlt...). --AndreasPraefcke (Diskussion) 21:14, 17. Jul. 2012 (CEST)

Parameter: GNDCheck

Warum verwenden wir eigentlich den Parameter "GNDCheck" nur in Zusammenhang mit fehlenden Normdaten und nicht generell? Sollte es die GND in zehn Jahren noch geben, wäre es für die Wartung hilfreich zu wissen, wann die Normdaten das letzte Mal überprüft wurden. --Kolja21 (Diskussion) 00:52, 8. Jul. 2012 (CEST)

Versuch einer Antwort: GNDCheck dokumentiert den auf unserer Seite und für unsere Seite erkannten Wartungbedarf. -- Thomas Berger (Diskussion) 07:40, 8. Jul. 2012 (CEST)

Zzt. ist das so, aber nötig ist es nicht, oder sehe ich das falsch? (Um den Wartungsbedarf anzuzeigen, gibt es die Parameter "GNDName" und "GNDfehlt".) Natürlich sollte das Datum nicht im Artikel angezeigt werden, aber im Quelltext stört es nicht und könnte langfristig hilfreich sein. Spätestens nach fünf Jahren will man eigentlich immer wissen, von wann eine Information stammt. Ich kann mir gut vorstellen, dass die Entwicklung der GND noch nicht abgeschlossen ist. Es gibt zahlreiche europäische Nationalbibliotheken und Bibliotheksverbünde, die keine eigenen Normdateien betreiben; die könnten beispielsweise als Partner ins Boot geholt werden. Ganz zu schweigen von der Einführung neuer Entitäten oder was sich sonst noch alles ändern mag. --Kolja21 (Diskussion) 02:55, 9. Jul. 2012 (CEST)

Es gibt da einen Nexus durch die aktuelle Programmierung der Normdaten-Vorlage: Ist der Parameter GNDfehlt eingetragen, wird die Kategorie Wikipedia:GND_fehlt_... belegt, notfalls auch "ohne Datum", was dann wiederum sofortigen Wartungsbedarf anzeigt so dass ein Bearbeiter dann den Parameter GNDCheck nachträgt. Ebenso führt jegliches Vorhandensein des Parameters GNDName zum Eintrag in einer der GND_fehlt-Wartungskategorien.
Beides ist nicht zwingend, sondern reflektiert unsere derzeitige Ansicht über die Entwicklungsrichtung der GND und unsere Einflussmöglichkeiten: Nämlich dass Tn-Sätze in de:WP unerwünscht sind, dass Tn-Sätze stets zugunsten Tp-Sätzen abgebaut werden, dass Meldungen auf WP:PND/F irgendwann zu Reaktionen führen, die Nacharbeit in der Wikipedia erfordern, und dass wir evtl. irgendwann anhand von WP-Artikeln einfache Neusätze anlegen dürfen. D.h. gewisse Defizite und Inkonsistenzen in der GND werden von uns wahrgenommen, wir übernehmen durch Meldungen an die DNB eine Teilverantwortung für deren Bereinigung, und daher antizipieren wir für einen unbestimmten Zeitpunkt in der Zukunft Wartungsbedarf in der Wikipedia: Der wird durch GNDCheck dokumentiert, wobei wir nicht den geschätzten Zeitpunkt des Wartungsbedarfs eintragen ("Wiedervorlage Januar 2016") sondern den der letzten Auseinandersetzung mit der GND in Bezug auf diesen Artikel: Wenn GNDCheck nur ein paar Monate in der Vergangenheit liegt wissen Bearbeiter, dass es lohnendere Beschäftigungen gibt als auf reinen Verdacht hin ausgerechnet diesen Artikel erneut zu überprüfen.
Außerdem dienen die Wartungskategorien der Wikipedia-internen Qualitätssicherung: Jeder Personenartikel sollte auch die Vorlage:Normdaten enthalten und darin stets den GND-Parameter, außer natürlich in Fällen wo die GND nichts hergibt. Um die Fälle "noch nie geprüft" und "geprüft aber ohne Ergebnis" zu unterscheiden, wird mit GNDfehlt eine spezielle Nicht-Information positiv markiert. Hier kann man sich (siehe erster Absatz meiner Antwort) fragen, ob die Vergabe eines Datums nicht overkill ist: Theoretisch ist bei jeglicher im Artikel enthaltenen Einzelinformation die Datierung interessant (daher die Versionsgeschichte bzw. die Werkzeuge, die daraus die Änderungen an einem bestimmten Artikelabschnitt extrahieren können), Datierung von nicht enthaltener Information (etwa kein Hochschulabschluss oder keine zweite Ehefrau angegeben: Gab es keine oder war das Faktum dem Artikelautor nicht bekannt, weil die Quelle xy erst nach dem Zeitpunkt erschienen ist, an dem der Autor die Information eingetragen hätte?) ist eigentlich noch viel interessanter, aber in dieser Allgemeinheit vermutlich völlig jenseits der menschlichen Möglichkeiten zur Wissensorganisation. Mit GNDfehlt + GNDCheck tun wir das für ein winziges Bröckchen innerhalb der Normdatenvorlage, aber bereits für LCCN oder VIAF-Parameter tun wir es nicht: Motivation ist halt, dass wir einen Vollständigkeitsanspruch bezüglich "GND" haben, den es in der Wikipedia ansonsten nur bei wesentlich kleineren Personengruppen (etwa Nobelpreisträgern) gibt: Dort wird die Kontrolle allerdings durch Überwachung von Redlinks in Listenartikeln ausgeübt. -- Thomas Berger (Diskussion) 10:53, 9. Jul. 2012 (CEST)

Hallo Thomas, danke für dein Gutachten! Wenn ich deine Ausführungen richtig verstanden habe, hältst du die allgemeine Angabe des Datums für einen "overkill" an Informationen. Überzeugt bin ich nicht, aber erschlagen :D --Kolja21 (Diskussion) 16:15, 9. Jul. 2012 (CEST)

Hallo Kolja, danke, so kann man es kürzer sagen. Oder mittellang: Wir müssen im Blick behalten, für welches Datenelement oder welchen Umstand das Datum GNDCheck bei der Wartung helfen soll, wenn wir da zu viele Dinge draufladen, fliegt uns alles um die Ohren. -- Thomas Berger (Diskussion)

Statistik: Layout (erl.)

Auf die Frage: "Schöner so?", lautet meine Antwort: "nö". Die Anführungszeichen irritieren und die Schattierung verläuft im Zickzack über zwei Spalten. Da es die Tabelle auch unter Vorlage:NORMDATENCOUNT/Doku gibt, und dort entsprechend angepasst werden müsste, schlage ich einen Revert vor. --Kolja21 (Diskussion) 15:19, 12. Jul. 2012 (CEST)

PS: Wäre es nicht sinnvoll, die Statistik als Vorlage auszulagern? --Kolja21 (Diskussion) 15:21, 12. Jul. 2012 (CEST)

Das ging ja schnell. Das Layout wurde schon wieder (diesmal einheitlich) überarbeitet. Damit erledigt. --Kolja21 (Diskussion) 15:25, 12. Jul. 2012 (CEST)

Formatierung LCCN angeblich falsch

Bitte seht euch mal kurz Ophelia Lovibond an und klickt auf die LCCN. --Mai-Sachme (Diskussion) 11:35, 28. Jul. 2012 (CEST)

Die Tatsache, dass mein Skript der Ansicht ist, dass man die LCCN entfernen sollte, spricht sehr dafür, dass da irgendwas komisch ist. Die eingetragene LCCN, die auch so auf der VIAF-Seite steht, ist jedenfalls nicht in den maschinenlesbaren Daten vorhanden, die mein Skript von viaf.org abruft. Eventuell in den Parameter REMARK verschieben, und irgendwann später noch mal nachsehen, ob sich das Problem von selbst gelöst hat. --Schnark 11:44, 28. Jul. 2012 (CEST)
Andererseits stellen [26] und [27] den Datensatz korrekt dar. Vielleicht ist der Index für [28] einfach nur noch nicht aktualisiert, der Datensatz ist ja offenbar ziemlich neu (in VIAF eingetragen 2012-07-25)? Vielleicht einfach noch mal ein paar Tage abwarten. --FordPrefect42 (Diskussion) 11:49, 28. Jul. 2012 (CEST)
Querverweis auf Hilfe_Diskussion:Normdaten#Problem_mit_LCCN-Link. Gleiche Symptomatik. Und auch für Ophelia Lovibond führt die Suche unter authorities.loc.gov auf den "offiziellen" aber derzeit nicht-funktionierenden Permalink http://lccn.loc.gov/no2012076362 – Screenshot unter http://imgur.com/f3TdYMake (Diskussion) 19:48, 28. Jul. 2012 (CEST)

Ganz allgemein: Gibt es keine Möglichkeit, von der DNB wegzukommen?

Die GND wird immer schlechter (ständige Dubletten, schrottige Pseudodatensätze, Fehler werden monatelang nicht bearbeitet). Die Bibliothek praktiziert das Gegenteil von Öffentlichkeit, selbst ihre Lesesäle kosten Eintritt. Und jetzt schließt die DNB auch noch ihre wenigen Digitalisate (die der jüdischen Exilpresse) ohne jede Not aus angeblichen "Rechtsgründen" weg, wohl nur, um freie Inhalte zu behindern. Wieso unterstützen wir eigentlich diese schlechteste aller Nationalbibliotheken, die keinem Deutschen bei allen Kosten auch nur den geringsten Wert einbringt, auch noch mit unserer Arbeit? Die GND ist frei, wir sollten sie nehmen und das ganze selbst in die Hand nehmen, dann kann die DNB bleiben wo der Pfeffer wächst. --FA2010 (Diskussion) 16:07, 30. Jul. 2012 (CEST)

Hallo Krawallsocke, die Analyse stimmt (teilweise. Mein Eindruck ist, im Vergleich zu anderen Nationalbibliotheken steht die DNB recht gut da, wenn man mal von den eigentlichen Beständen absieht), aber vermutlich prügelst Du den falschen Esel: Die DNB ist halt darauf angewiesen, ihre genuine Klientel, nämlich die Regionalen Bibliotheksverbünde, bei Laune zu halten und die sind durch ihr Bestreben, Innovationsdruck abzubiegen, so arg strapaziert, dass ihnen wenig echte Arbeit zumutbar scheint. D.h. die DNB hält des öfteren den Kopf hin, weil ihre "Partner" ihre Hausaufgaben nicht machen. Vermutlich könnten DNB und Wikipedia zusammen, ohne die anderen, eine bessere GND betreiben, weil sich das Normdatenverständnis dann besser deckt. "Wikipedia" alleine ist witzlos, weil das ein einfacher Dump der Personendaten-Templates ist: Da fällt dann gerade die Verzahnung mit anderen Communities weg. Alternativ könnten wir uns natürlich an eine andere Normdatei klammern, die müsste aber konzeptionell vergleichbar modern sein (also etwa exakte Lebensdaten und Geburtsorte erlauben), da fällt mir aber keine ein, ausser vielleicht XA (v.a. weil ich da das Datenformat nicht kenne) und nichtbibliothekarische Sachen wie MusicBrainz oder IMDb, die aber thematisch recht eng sind. In der Normdatenredaktion fällt in jedem Fall viel Arbeit an, denn was wir derzeit produzieren sind ja nur "Meldungen", die dann von "Redakteuren" eingearbeitet werden müssen. Bei unserem derzeitigen Verfahren werden ausserdem noch massiv Titelzuordnungen in der DNB korrigiert, das bremst (wenn jemand drittes hier redaktionell eingreifen würde, wären sie theoretisch im Zugzwang und hätten nur wenig Zeit, ihre Zuordnungen zu reparieren. Oder aber es würde niemals wieder ein Tn-Satz aufgelöst).
Ich bin leider nicht über die Gesamtstrategie orientiert, wie DNB plus "Partner" (hier: GND-"Teilnehmer", also die mit Schreibzugriff auf das ILTIS-System) mittelfristig einige Millionen unbrauchbarer Datensätze aufräumen wollen (und Tn-Sätze sind unbrauchbar, die Arbeitsvermeidungsstrategie, aufgrund der sie seinerzeit eingeführt wurden, ist im Nachhinein nur eine Aufschiebestrategie gewesen, finde ich), aber vielleicht sollten wir (Raymond?) doch einmal ein Gespräch anregen, in dem die DNB klar äußern kann, wieviel Arbeit die redaktionelle Bearbeitung unserer Meldungen wirklich ist und ob bzw. in welchem Masse sie das überhaupt leisten kann. Dann könnte man auch ernsthaft über Auswege reden, vorzugsweise organsiatorische (die Verursacher der schlechten Sätze stärker in die Pflicht nehmen), technische (sowieso, vermutlich fällt aber niemandem etwas ein, die Bearbeitungseit pro Meldung vom Minuten- in den Sekundenbereich zu drücken, ich glaube aber, dass alle GND-Redakteure mit BEACON-Mitteln deutlich effizienter arbeiten könnten als mit den momentan verpflichtenden KVK-Recherchen), und möglicherweise auch mit den vor Jahren in die Diskussion gebrachten "Redaktionsbefugnissen" für "Wikipedia" (was aber realistischerweise bedeutet, dass der Wikimedia-Verein einen Arbeitnehmer spendiert, der dann in einer Bibliothek mit vielen Nachschlagewerken installiert wird und hauptamtlich Normdatenarbeit macht). -- Thomas Berger (Diskussion) 17:44, 30. Jul. 2012 (CEST)
Zum letzten Satz: Nunja, WMDE hat ja Gerüchten zufolge sowieso tendenziell Probleme, ihre Spendeneinnahmen auszugeben und gerade erst zur Verwirklichung von Wikidata 12 (!) Mitarbeiter eingestellt. Vielleicht ist die Einstellung/Beauftragung/Finanzierung eines hauptberuflichen Normdatlers gar nicht mal so unrealistisch, da ja auch die erhofften Ergebnisse dabei sich recht gut mit den Kriterien decken, die etwa beim CPB eingefordert wurden (freies Wissen, Bezug zu Wikimedia-Projekt, Nachhaltigkeit), und die Thematik sowieso hervorragend zu den bevorzugt geförderten GLAM-Bereichen einschließlich Wikipedian-in-Residence-Strategie passt. --Mai-Sachme (Diskussion) 18:00, 30. Jul. 2012 (CEST)

In diesem Zusammenhang eine allgemeine Frage: Hat die für Juli angekündigte maschinelle Zusammenführung der Dubletten schon begonnen? Es wäre schön, wenn sich die DNB hier gesprächiger (ergo: transparenter) zeigte. --Monsieur Becker (Diskussion) 20:29, 30. Jul. 2012 (CEST)

Exakt hier ist die DNB traditionell nicht besonders gesprächig. Auf ihren Webseiten auch nicht unbedingt. Auf der ZDB-Info-Liste (Archiv leider nur für Subskribenten geöffnet) gab es allerdings am 3.7. die Ankündigung, dass am 9. oder 11.7. mit der Zusammenführung begonnen würde, und zwar zunächst für Kongresse, dann für Körperschaften und zum Schluss für Geographika. Man geht davon aus, dass die automatischen Verfahren im Oktober beendet sein werden (und dass allerhand für intellektuelle Abgleiche übrig bleiben wird: Sobald Vorgänger oder Nachfolger vermerkt sind muss beispielsweise berücksichtigt werden, dass GKD und SWD unterschiedliche Regeln für solche sogenannten "Splits" hatten). -- Thomas Berger (Diskussion) 23:07, 30. Jul. 2012 (CEST)
Personen werden aber auch automatisch zusammengeführt, oder? -- Monsieur Becker (Diskussion) 13:02, 9. Aug. 2012 (CEST)
In der ZDB-Info-Mail ist nur von der „maschinelle[n] Zusammenführung der doppelten Datensätze aus der ehemaligen GKD und SWD“ die Rede. -- Rosenzweig δ 18:08, 11. Aug. 2012 (CEST)
Hi. Ich war letzte Woche zu Besuch in der DNB und habe die Gelegenheit genutzt, mich mit meinen ehemaligen Kolleginnen/Kollegen zu treffen. Seit ich das letzte Mal dort war, hat sich eines getan, angefangen von der Zusammenlegung von PND, SWD, GKD zur GND. Der zweite große Hammer war die Entscheidung der DNB, die Normdaten unter Creative Commons Zero herauszugeben und als Datenpaket zum Herunterladen anzubieten. Gleiches geschieht mit den Titeldaten. Was die Zusammenlegung angeht, ist das ein (ihr höre jetzt von euch ein "ach") noch nicht abgeschlossener Prozess und wenn ich das mit meinen eigenen Worten richtig beschreibe, ist der Lag noch recht groß, weil ein Teil der Verbünde beim Mergen noch gewisse Rückstände hat und aus anderen Gründen. Gibt es denn jemanden, der beispielsweise das Projekt PeEnDe ausbauen würde, damit die dort erzeugten Datensätze den aktuellen GND-Richtlinien entsprechen würden? -- Mathias Schindler (WMDE) (Diskussion) 09:00, 13. Aug. 2012 (CEST)
Die Abschlussfrage kommt meines Erachtens etwas überraschend. Mich würde interessieren, mit welcher Intention sie gestellt wurde. --Monsieur Becker (Diskussion) 09:24, 16. Aug. 2012 (CEST)
Die Intention ist, Dinge zu tun, die von der DNB übernommen werden können. Und Tp-Sätze aus Wikipedia-Daten wären ein guter Start. PeEnDe kann das schon ganz gut, die aktuellen Felder entsprechen aber nicht den aktuellen GND-Feldvorgaben. -- Mathias Schindler (WMDE) (Diskussion) 09:08, 20. Aug. 2012 (CEST)

Botflag

Ich gehe jetzt den Rest der Kategorie:Wikipedia:Normdaten-TYP fehlt an (Buchstabe A schon erledigt). Das sind die Artikel, die LCCN und/oder VIAF enthalten, aber keine PND hatten. Alle Nichtpersonen habe ich ja schon vor kurzem herausgefiltert und allesamt mit Typen versehen (das war etwas komplizierter). Die jetzige Vorgehensweise: vielversprechende (deutschsprachige Personen, andere Autoren, Musiker, Komponisten, Personen ohne VIAF, Personen mit nur VIAF) mit Hand per Normdatenskript mit bislang ganz guter Trefferquote bei VIAF und auch in der GND, den Rest (da bleiben hauptsächlich US-amerikanische Kongressabgeordnete) automatisch: da muss eigentlich überall nur "TYP=p" rein. Solche Restaufgaben würde ich wieder mit dem AutoWikiBrowser erledigen, würde dafür aber gerne ein BotFlag erhalten, da das die Beobachtungslisten der anderen User doch eher über Gebühr strapaziert. Daher habe ich bei Wikipedia:Bots/Anträge auf Botflag dieses Flag für einen Nutzer Benutzer:FA2010Bot beantragt. Wenn Einwände bestehen, bitte dort äußern. --FA2010 (Diskussion) 09:37, 1. Aug. 2012 (CEST)

Die vielen US-amerikanischen Politiker (die erfahrungsgemäß nur ganz, ganz, ganz selten GND-Einträge haben), habe ich jetzt per AWB (mit Botflag) mit TYP=p versehen; daher ist jetzt die Arbeit mit der Kategorie sicherlich weniger ermüdend. --FA2010 (Diskussion) 13:06, 9. Aug. 2012 (CEST)

"No longer part of VIAF"

Immer mal wieder kommen mir Sätze wie http://viaf.org/viaf/112009186/ unter die Finger. So etwas ist natürlich höchst unbefriedigend. Neben der allgemeinen Wechselhaftigkeit der Cluster ist das ein weiteres Argument dafür, VIAF nicht als Allheilmittel zu sehen, sondern die nationalen Normdaten redundant vorzuhalten. --AndreasPraefcke (Diskussion) 14:56, 15. Aug. 2012 (CEST)

Ich habe diese Datensätze bisher nur gesehen, wenn der nationale Eintrag (in meinen Fällen GND) nicht mehr vorhanden ist (oder nur noch als Weiterleitung) und es sich eben nicht um ein Cluster handelte (sondern ausschließlich der GND-Eintrag dazugehörte). Solche gelöschten Einträge gibt es wie gesagt auch in der DNB und daher ist das meiner Meinung nach nichts neues oder schlechteres als bei nationalen Normdateien. --APPER\☺☹ 02:00, 16. Aug. 2012 (CEST)
Wenn ich es recht sehe, wurde NII generell aus der VIAF entfernt. Im Cluster http://viaf.org/viaf/49224511/ beispielsweise gibt es in Entwicklungshistorie die Anmerkung, dass der Datensatz im April 2010 aufgenommen und im Oktober des gleichen Jahres wieder entfernt wurde. Eine gezielte Suche nach der NII-ID liefert zumindest bei mir kein Ergebnis. Insofern deute ich diese Entwicklung nicht als Zeichen von Inkonsistenz. Ich nehme an, vom o. g. jetzt ungültigen NII-VIAF-Eintrag zu Eugene Kennedy wäre eine automatische Weiterleitung zum Cluster http://viaf.org/viaf/39897207 vorhanden, wenn der NII-Datensatz nach Einspielung dem Cluster zugeordnet worden wäre. --Monsieur Becker (Diskussion) 09:01, 16. Aug. 2012 (CEST)
Ja, auf der VIAF-Startseite ist NII nicht mehr aufgeführt und ich bin ziemlich sicher, dass es dort mal gelistet war. Woran ich mich nicht erinnere ist, ob NII damals als "experimentell" klassifiziert war (wie derzeit zB BIBSYS Norwegen). Wenn der Status von NII entsprechend gekennzeichnet war, dann ist es doch OK, wenn ein zugehöriger Datensatz verschwindet, zumal ja unter http://viaf.org/viaf/112009186/ immer noch eine mehr oder weniger aussagekräftige Statusinfo zu finden ist. (Wobei ich in der History konsequenterweise noch einen "delete"-Eintrag erwarten würde.) Ich gehe auch davon aus, dass die Cluster-Nummer 112009186 nicht irgendwann neu vergeben wird.
Vielleicht zum Vergleich und generell ganz interessant die History von http://viaf.org/viaf/39897207/ (Eugene C. Kennedy): Ein zugeordneter NII-Datensatz wird ebenfalls im OktoberNovember 2010 entfernt (Monsieurbecker verwechselt dies oben auch :). Weiter zu beobachten: Munteres Cluster-Hopping von zwei DNB-Datensätzen in 2011-04 und 2012-02. Wobei ich es auch grundsätzlich für einen Fehler halte, dass VIAF die als "undifferentiated" erkannten DNB-Datensätze überhaupt zur Clusterung verwendet. – Dass die derzeitige Praxis – VIAF und nationale Normdaten werden parallel erfasst – höchst vernünftig ist, scheint mir hier "bei uns" breiter Konsens zu sein. Grüße Make (Diskussion) 14:51, 16. Aug. 2012 (CEST)

Vorschlag zur Masseneinspielung von VIAF-Nummern in en:WP

von den "Wikipedians in Residence" bei OCLC und der British Library: en:User:Maximiliankleinoclc/Authority_control_integration. Interessant finde ich die Andeutungen (oder habe ich da etwas falsch verstanden), dass die (en)-Wikipedia-Links, die mir auch bereits in VIAF aufgefallen waren, wegen der strukturierten Persondata-Inhalte anscheinend recht stabilisierend auf die Clusterung wirken, insofern also für VIAF echten Nutzen haben und nicht nur populistisches Beiwerk sind. -- Thomas Berger (Diskussion) 21:23, 18. Jun. 2012 (CEST)

Klasse. Hatte schon lange gehofft, dass die engl. WP die Normdaten englich in größerem Maßstab nutzt. Bisher war die Nutzung dort ja kaum vom Fleck gekommen. Ich hatte drüben zwar auch mal ein bißchen in dem Bereich gemacht, hatte aber einfach nicht die nötige Zeit, Energie und Connections, um das dort auf breitere Beine stellen zu können. Vor allem bin ich gespannt, was die breite Nutzung der Normdaten in der engl. WP an Auswirkungen außerhalb der Wikipedia haben könnte. --Kam Solusar (Diskussion) 11:59, 19. Jun. 2012 (CEST)
Schließe mich Kam Solusar an - es wäre ja auch für mich technisch ein leichtes gewesen, deutsche Normdaten + VIAF/LCCN per Bot in die en.wp einzuspielen, aber ich habe hier in de.wp genug zu tun und keine "Zeit, Energie und Connections", mich um die en.wp zu kümmern. Gut kanns nur sein! --APPER\☺☹ 15:02, 19. Jun. 2012 (CEST)
Danke für den Hinweis. Ich hab mal etwas in dem Skript wikipedia2auth3.py von en:User:Maximiliankleinoclc/Authority_control_integration gestöbert. Kurze Skizze, was es wie macht folgt in eigenem Unterabschnitt (soweit ich durchblicke, direkte Korrekturen, Ergänzungen erwünscht). – Vielleicht hat jemand Lust anzufragen, ob VIAF nicht weiteren Code "rausrückt". Die Versuchung bei mir ist groß, da selber nachzuhaken. Die Erfahrung, dass das zu faszinierenden aber zeitgefräßigen Aktivitäten führt, hält mich (vernünftigerweise ;-) auf Distanz. -- Make (Diskussion) 15:22, 20. Jun. 2012 (CEST)

A propos VIAF: die sind dabei, die japanische NDL einzubauen: http://outgoing.typepad.com/outgoing/2012/05/just-links.html (comments) --AndreasPraefcke (Diskussion) 22:24, 20. Jun. 2012 (CEST)

Jau, und ich hatte deswegen sogar schon einmal angenommen, die NDL sei schon längst drin in VIAF: Wikipedia_Diskussion:Normdaten/Archiv#Weitere_Punkte. Aufruf der genannten Beispiele gibt die identischen Ergebnisse wie im Blog-Post, nur eben ohne NDL. -- Thomas Berger (Diskussion) 22:35, 20. Jun. 2012 (CEST)
Ah, das hatte ich irgendwie damals nicht mitbekommen. Immerhin haben wir jetzt auch die Bestätigung. --AndreasPraefcke (Diskussion) 12:22, 21. Jun. 2012 (CEST)

wikipedia2auth3.py

  • Funktionalität: Python-Skript, das aus einem en:Wikipedia-XML-Dump eine Datei mit MARC-konformen Authority-Datensätzen erstellt.
  • Funktionsweise:
    • Jeder Wikipedia-Artikel wird zunächst darauf geprüft, ob er eine Person beschreibt. Dazu werden (u.a.) die Unterkats von en:Category:Births by year / en:Category:Deaths by year und en:Template:Infobox person ausgewertet.
    • Nicht berücksichtigt werden en:Template:Persondata und en:Template:Authority control
    • Kandidaten für Werke von und über die Person werden ermittelt durch Parsen von en:Template:Citation (= en:Template:cite) und Sammeln aller im Artikel auftretenden ISBN, ISSN sowie buchstabenfreier LCCN.
    • Kandidaten für den zur Person gehörigen LoC-Authority-Datensatz werden ermittelt durch Sammeln von LCCN aus Weblinks auf Worldcat inkl. en:Template:Worldcat, die mindestens einen Buchstaben enthalten – Regular-Expression-Patterns (Zeilen 156,157, siehe python-re-documentation) dafür
      • \{\{worldcat.*?lccn-([\d\- a-z]+)
      • identities/lccn-([\d\-a-z]+)
    • diverse Plausibilitätsprüfungen und konsequente Bereinigung eliminieren und verhindern Datenmüll (zB werden 1. Literaturverweise, die den Personennamen nicht grob enthalten, verworfen 2. (? sachlich richtig ?) Literaturverweise mit einer "Blacklist" NoiseTitles abgeglichen, die irreführende/zu allgemeine Titel enthält)
  • kleine Spekulation, wie die en:Wikipedia-Pseudo-Authority-Datensätze stabilisierend bei der Clusterung von VIAF eingesetzt werden: Man wirft die ganz naiv in den Pool der regulären Datensätze und läßt die Clusteralgorithmen arbeiten. Dann können die Wikipedia Datensätze als Attraktoren wirken und schwach matchende Datensätze aus anderen Clustern abziehen oder wie unsichtbarer Kitt die Datensätze eines Clusters enger zusammenhalten.

Jetzt als RFC in neuer Version

en:Wikipedia:Authority control integration proposal/RFC --AndreasPraefcke (Diskussion) 17:06, 29. Jun. 2012 (CEST)

Update: Diskussion ist inzwischen abgeschlossen mit breitem Konsens pro Bot-Einspielung der VIAF-IDs in en:Template:Authority control. Der Bot wird unter https://github.com/notconfusing/VIAFbot entwickelt. Bin echt gespannt, wie die allgemeine Reaktion in en aussehen wird, wenn der Bot losläuft. (Von wütendem Protest bis gelangweiltem Desinteresse scheint mir alles möglich.) Die Diskussion verlief eher entspannt, wobei ich persönlichen Erkenntnisgewinn in Sachen British Library Authority ControlNACOLoC-Authorities verbuchen konnte. -- Make (Diskussion) 15:49, 16. Aug. 2012 (CEST)

Update: Erste Tests ohne die erforderliche Genehmigung haben am 17. August 2012 zu einem Block für den Bot geführt: [29]. Der Bot hat inzwischen eine Freigabe für einen Testlauf erhalten: en:Wikipedia:Bots/Requests_for_approval/VIAFbot. Für die Durchführung des Tests ist derzeit ein Termin vor dem 1. Oktober 2012 geplant. Ohne mir Details genau angeschaut zu haben, ist en:User:VIAFbot von der Struktur doch ein schöner Ansatz. Nicht ganz nachvollziehen kann ich grad, warum für den Botlauf die mittlerweile 6 Monate alte VIAF-Liste verwendet wird und keine aktuelle. (Hab ich vllt aber auch falsch verstanden.) -- Make (Diskussion) 20:37, 11. Sep. 2012 (CEST)

Kleiner Meilenstein

In der Kategorie:Wikipedia:Normdaten-TYP fehlt sind jetzt nur noch Personenartikel (folglich könnte man diese auch per Bot auf TYP=p umstellen, wenn man will, aber sinnvoller ist es sicher, immer mal wieder ein paar mit dem Normdaten-js anzuschauen und dabei zu sehen, ob für die GND Vorschläge erscheinen). --AndreasPraefcke (Diskussion) 22:51, 15. Jul. 2012 (CEST)

Perfekt! Auch ohne Bothilfe geht die Arbeit gut voran. (Allerdings ohne mich, bin auf dem Sprung in den Urlaub ;) Danke auch für die Listen, wie Benutzer:Gymel/NDmiss. Die sind ein wahre Fundgrube und motivierender als die Abarbeitung nach Alphabet. --Kolja21 (Diskussion) 23:04, 15. Jul. 2012 (CEST)
Man entdeckt ja immer wieder neue Arbeitslisten und Wartungskategorien zum Thema Normdaten. Sind die irgendwo gelistet? --Mai-Sachme (Diskussion) 13:20, 16. Jul. 2012 (CEST)
Ja, mittlerweile gibt es dafür die Kategorie:Wikipedia:Normdaten-Wartung. Dort sind alle Listen eingetragen. --Kolja21 (Diskussion) 17:38, 16. Jul. 2012 (CEST)

Und noch ein kleiner Meilenstein: heute waren erstmals 50.000 Personen mit GND (und nicht PND) versehen. --FA2010 (Diskussion) 15:22, 9. Sep. 2012 (CEST)

Personendatensatz mit falsch zugeordneter Literatur

Bei der normdatenbezogenen Überarbeitung des Artikels Gustav Zander, ein schwedischer Arzt (GND 119303450 sowie 173892205), bin ich darauf gestoßen, dass dieser Person beispielsweise in der hbz-Verbunddatenbank rechtswissenschaftliche Titel (Danziger Handelsgebräuche, Aus dem Danziger Rechtsleben, Der Kauf auf Abruf und Klauseln im Handelsverkehr) zugeordnet wurden, bei denen ich mir nur schwer vorstellen kann, dass sie tatsächlich von diesem konkreten Gustav Zander stammen. Auch findet sich ein Werk namens Über Stichverletzungen des Abdomens, mit der Autorenangabe "Gustav Zander, approb. Arzt aus Halle a. S.". Halle liegt nun kaum in Schweden. Daher meine Frage, wie man damit umgehen soll. --Monsieur Becker (Diskussion) 11:04, 25. Aug. 2012 (CEST)

Weil unsere geheime Agenda ja ist, möglichst viele Personen in die GND zu bekommen, habe ich die doppelte Tp-Verzeichnung des Schweden als Vehikel genutzt, über WP:PND/F aufgrund der in den Verbünden vorhandenen zusätzlichen Literatur auf die beiden anderen Personen hinzuweisen (Obwohl der Danziger anscheinend eine hohe regionale Bedeutung hatte, habe ich leider keine Nachweise gefunden). -- Thomas Berger (Diskussion) 12:05, 25. Aug. 2012 (CEST)

Korrekturmeldungen bei Nicht-Personen-Datensatzsätzen der GND?

Bei Personendatensätzen der GND gibt es ja einen Link auf ein Kontaktformular der GND-Personenredaktion um Korrekturen anzuregen, und alternativ auch noch WP:PND/F. Aber gibt es auch eine einfache Möglichkeit, Korrekturen bei anderen Normdatentypen anzuregen? Gerade bei etwa Sachbegriffen kommt es immer wieder mal vor, dass Normdaten wieder aus den Artikeln entfernt werden, weil die jeweiligen Autoren die Definition oder andere Angaben im verlinkten Datensatz als falsch oder zumindest nicht 100%ig korrekt ansehen. --Kam Solusar (Diskussion) 20:09, 3. Sep. 2012 (CEST)

Nicht das ich wüsste. Ich denke, die DNB will sich vor Endlosdiskussionen schützen und ist mit den Anfragen zu den Personen-GNDs schon zeitlich überfordert. --Kolja21 (Diskussion) 00:33, 4. Sep. 2012 (CEST)
Schade. Einerseits zwar verständlich (vor allem wenn einige Leute hier dann die DNB mit ihren politisch, religiös, etc. motivierten Diskussionen nerven würden), andererseits ist es natürlich schon ärgerlich, wenn Fehler und grobe Ungenauigkeiten nicht korrigiert werden können. --Kam Solusar (Diskussion) 20:42, 5. Sep. 2012 (CEST)
Ich denke, für Körperschaften (im neueren, engeren Sinn der GND) könnte es wie bei Personen laufen, "nur" dass es da aufgrund von Namensänderungen häufiger mehrere GND-Sätze gibt, jedoch nur einen WP-Artikel, der die gesamte Historie abdeckt. Letzteres ist auch der Ansatz in der SWD gewesen, wenn es also um das Versammeln von Literatur über eine Körperschaft ging: Dort werden ja Entwicklungen und Kontinuitäten naturgemäß nicht ausgeblendet... Bei Sachbegriffen und Geographika beginne ich hingegen immer mehr zu zweifeln, ob das Hinterlegen der Normdaten in Artikeln Sinn macht, oder nicht besser an Kategorien erfolgen sollte. Zwei Beispiele aus der stetig wachsenden Liste mehrfach zugeordneter GND-Nummern:
  1. Brandenburg und Provinz Brandenburg: Hier unterscheidet die Wikipedia zwischen allen historischen Staatlichkeiten, die GND jedoch (weil nun Geographikum und keine Körperschaft mehr) fasst alles zusammen.
  2. die GND identifiziert Pflanzenökologie (Vorzugsbenennung) mit Vegetationsökologie innerhalb der Ökologie, sowie Pflanzensoziologie (Vorzugsbenennung) mit Vegetationskunde innerhalb der Geobotanik. Pflanzensoziologie verstehe ich jedoch so, dass dazu Vegetationskunde der Oberbegriff ist, und Pflanzenökologie ist Oberbegriff sowohl von Vegetationskunde als auch von Vegetationsökologie. Man würde beim Folgen aller Verästelungen vermutlich irre werden, aber selbst Betrachtung der Einzeldatensätze zeigt hier Vorzugsbenennungen der GND, die aus unserer Sicht "falsch" sind, da eines der in der GND hinterlegten (Quasi-)synonyme aus unserer Sicht Oberbegriff ist. Nur: Die GND beruft sich vorzugsweise auf Universaldarstellungen wie Meyers oder Brockhaus, die WP auf aktuellere Lehrbücher etc. Das kann m.E. nie zufriedenstellend gelöst werden. -- Thomas Berger (Diskussion) 09:55, 6. Sep. 2012 (CEST)
Hallo Thomas, natürlich hast du recht, dass die Zuordnung nie für alle Artikel perfekt gelöst werden kann. Aber auch Wikipedia wird nie perfekt und abgeschlossen sein. Allerdings sehe ich nicht, worin der Vorteil liegt, wenn wir statt der Artikel die Kategorien verknüpfen würden. 1. wird auch dann nicht jede Zuordnung unstrittig sein, und 2. verlinken die Bibliotheken auf Wikipedia zurück. Wenn ich auf den entsprechenden Begriff oder Namen klicke, möchte ich klare Auskünfte und keine beliebige Sammlung von Onlineartikeln. Ganz abgesehen davon, gibt es ja nicht nur die deutschsprachige Wikipedia. Das Kategoriensystem in der englischen Ausgabe unterscheidet sich teilweise erheblich von "unserem". Gruß --Kolja21 (Diskussion) 18:56, 6. Sep. 2012 (CEST)
Bei Geo-Objekten würde ich das nicht so schwarz sehen. Bei Gebietskörperschaften ist das in der Tat teilweise schwierig weil es da oft zwischen GND-Datensätzen und Wikipedia-Artikeln keine 1:1-Beziehungen sondern eher 1:n-Beziehungen gibt. Aber bei einem großen Teil der Geografika wie Inseln, Bergen, Seen, aber auch den meisten kleineren Orten gibt es eigentlich kaum Zuordnungsprobleme. Ich denke, das sollte uns nicht davon abhalten, die Normdaten dort in Artikel einzugetragen, wo sie genau passen. Wenn ich mir die ellenlangen täglichen Diskussionen über Kategorien, deren immer kleinteiligere Unterteilung, schwammige Abgrenzung, unklare Definitionen, etc.. so ansehe, glaube ich nicht, dass es dort weniger chaotisch zugehen würde. --Kam Solusar (Diskussion) 17:50, 7. Sep. 2012 (CEST)
@Kolja: Die SWD war von nichtbibliothekarischen Communities nicht so bereitwillig aufgenommen worden, da ist der Fokus also noch ganz stark auf 1. bibliothekarische Erschliessung 2. monographischer 3. Literatur. Da werden oft mehrere Gedanken entwickelt, es sollen aber nicht allzuviele Schlagworte vergeben werden (die Verschlagwortung dient ja nicht nur dem Retrieval, sondern soll auch grob den Inhalt wiedergeben, wenn ein Aspekt nur mikroskopisch abgehandelt wird, ärgere ich mich darüber, das Buch besorgt zu haben). Insofern ist es aus GND-Sicht (derzeit) zweckdienlich, Begriffe und Konzepte zusammenzufassen und nicht bis ins feinste zu verästeln. Tendenziell werden wir dann aber zu einem GND-Begriff mehrere Artikel haben und die Frage ist, ob sich ein "Hauptartikel" identifizieren lässt, der gut auf alle damit zusammenhängenden verweist, oder ob es eine Kategorie gibt, die das besser leistet oder ob wir dieselbe GND-Nummer nicht doch in mehrere Artikel eintragen sollten (so dass der Resolver auf dem Toolserver die benötigte Überblicksfunktion realisieren kann).
@Kam: Vermutlich hast Du Recht in Bezug auf die Kategoriediskussionen. Bleibt jedoch festzuhalten, dass es Entitäten gibt, wo wir WP-Benutzer erwarten können, dass es zwischen Artikel und Normdatei-Eintrag ein "passt genau"-Verhältnis gibt und andere Bereiche, wo es selten passt, ohne dass das auf irgend einer Seite ein "Fehler" ist. Da wird es schwierig, Normdaten in passende Artikel einzutragen und ein Melden an die DNB dürfte frustrierend sein. -- Thomas Berger (Diskussion) 23:20, 7. Sep. 2012 (CEST)

VIAF: dublette Wikipedia-Pseudodatensätze

Nicht schön: Die VIAF-Cluster http://viaf.org/viaf/33432757/ und http://viaf.org/viaf/169183853 identifizieren identisch den en-Wikipedia-Artikel en:G. Wood als zugehörigen Pseudo-Datensatz. Nach den bisherigen VIAF-Erfahrungen ist das nicht wirklich überraschend, aber man muss erstmal drauf kommen. – Gefunden als zufälliger Problemfall von Benutzer:Gymel/VIAF-Zuordnungen. @Thomas_Berger: Wenn ich es richtig verstanden habe, wertest Du für die Liste direkt VIAF-Dumps aus. Könntest Du die Anzahl solcher Dubletten feststellen? -- Make (Diskussion) 21:52, 11. Sep. 2012 (CEST)

Nebenbemerkung: Die VIAF 169183853 kann man auf jedem Fall George Wood (Schauspieler) zuordnen. Oder sehe ich das falsch? --Kolja21 (Diskussion) 04:12, 12. Sep. 2012 (CEST)
http://viaf.org/viaf/169183853 passt genau. Das hatte mich auch so irritiert, denn diese richtige Zuordnung taucht nicht in den Arbeitslisten für den VIAFbot auf: http://dl.dropbox.com/u/10997393/wikilinks.out (von [30]) oder wikilinksforbot.out (von [31]) – Ist nicht direkt eine de:Wikipedia-Baustelle, aber es wäre natürlich schön, wenn der VIAFbot als Pilotprojekt möglichst geräuschlos ~250.000 Edits durchführen würde. Bin mir nicht sicher, ob dieses potenzielle Problem bereits bekannt ist. ... Muss mir das nochmal in Ruhe anschauen. -- Make (Diskussion) 10:56, 12. Sep. 2012 (CEST)
Hallo Make, es handelt sich um 29643 Einträge von en;WP mit mehrfachen VIAF-Nummern im Dump viaf-20120726-links.txt (ca. 301.500 Wikipedia-Links im Vergleich zu ca. 304.000 im vorausgegangenen Dump 20120524). -- Thomas Berger (Diskussion) 09:07, 12. Sep. 2012 (CEST)
Danke!!! -- Make (Diskussion) 10:56, 12. Sep. 2012 (CEST)

Siehe auch meinen Diskussionsbeitrag vom 3. Juli in en:Wikipedia_talk:Authority_control_integration_proposal#Using_de.wikipedia.27s_handpicked_data: "[...] processed the articles with Normdaten-template in de:WP (and interwiki to en:WP) and compared their VIAF number (if any) with the one provided by OCLC's mapping (if any): Of 702.000 interwiki links from de:WP to en:WP were 84.000 backed by OCLC's mapping, 51.100 had a VIAF number in de:WP's Normdaten-template, and 9.400 (=18%) of these differed from the one provided by OCLC's mapping! [...] Thus the huge discrepancy is not a sign of faults but can be interpreted as a successful "external" effort yielding > 9.000 intellectual identifications within VIAF in cases where the automatic match & merge had not succeeded!". D.h. übereinstimmende WP-Links bei verschiedenen VIAF-Clustern können ein Kriterium sein, in zukünftigen VIAF-Runden besser zu clustern. Aber das wurde im VIAF-Blog m.E. auch schon so formuliert. -- Thomas Berger (Diskussion) 09:34, 12. Sep. 2012 (CEST)

Personendaten bei Pseudonymen

Hallo, ich wollte wissen, was man macht, wenn ein Autor zwei Datensätze hat; also einen unter seinem richtigen Namen und einen unter Pseudonym! Zwei Datensätze einbinden kann man ja nicht.--XanonymusX (Diskussion) 17:02, 12. Sep. 2012 (CEST)

Da der zweite Datensatz im konkreten Fall nicht individualisiert ist (wie man das erkennt, steht auf Hilfe:GND), im Feld GNDName vermerken [32], Meldung auf WP:PND/F erstatten [33], eventuell in das Anmerkungsfeld der Normdatenvorlage Hinweis auf Meldung schreiben. --Mai-Sachme (Diskussion) 18:00, 12. Sep. 2012 (CEST)
Falls hingegen beide Datensätze individualisiert sind, einen auswählen, auf WP:PND/F Meldung erstatten und eventuell in das Anmerkungsfeld der Normdatenvorlage Hinweis auf Meldung schreiben. --Mai-Sachme (Diskussion) 18:03, 12. Sep. 2012 (CEST)
Ergänzung: Falls beide individualisiert sind (und das betrifft LCCN, wo "Bibliographische Identitäten" die Entitäten sind, noch viel stärker als die GND, die sich sehr nahe am Wikipedia-Personenkonzept orientiert), würde ich im Artikel die Normdaten eintragen, die zum Lemma passen und in der ohnehin erforderlichen Weiterleitung von der pseudonymen (oder realen - je nach Situation) Namensform die komplementären Normdaten eintragen. -- Thomas Berger (Diskussion) 18:12, 12. Sep. 2012 (CEST)
Besten Dank!--XanonymusX (Diskussion) 19:13, 12. Sep. 2012 (CEST)

Neue Wartungsliste

Es gibt wieder Futter für die rasenden Wartungslistenfresser unter Euch: Unter Benutzer:Gymel/GND-Probleme habe ich Listen abgeworfen, die aus dem Vergleich des GND-Auszugs vom Juli (Stand April) und dem aktuellen Wikipedia-Dump entstanden sind:

  1. Unbekannte, nicht existierende Nummern
  2. Inzwischen auf andere umgelenkte Nummern (auch hier existiert der GND-Satz nicht ... mehr)
  3. "Entitätenfehler": knapp 4.000 hier als Tp segelnde Tn, interessanterweise auch der umgekehrte Fall, die zu erwartende Konfusion zwischen Körperschaften und Geographika, sowie ein Sammelsurium von Fehlzuordnugnen hüben wie drüben.

Ihr könnt das ja einmal anschauen... -- Thomas Berger (Diskussion) 00:19, 22. Sep. 2012 (CEST)

Ich habe ein paar Einträge aus der Rubrik "Unbekannte Nummern" getestet: Alle GNDs (in den Artikeln) waren Tippfehler. Super Hilfe, die neue Liste! Thanx --Kolja21 (Diskussion) 00:58, 22. Sep. 2012 (CEST)

Sehe ich es richtig, dass der GND-Dump über fünf Monate alt ist? Es ist wohl wieder eines der unerklärlichen Geheimnisse, wieso die Bibliotheken die Daten nicht monatlich aktualisiert bereitstellen können. -- Monsieur Becker (Diskussion) 22:19, 22. Sep. 2012 (CEST)

Das ist mir nicht aufgefallen. Schlimmer finde ich, dass die VIAF das letzte Mal im Mai aktualisiert wurde. Der Dump stammt zwar vom Juli, die Daten werden aber noch nicht angezeigt. Außerdem scheint die LoC massiv unter Einsparungen zu leiden; ausländische Titel liegen teilweise ein Jahr in der Bibliothek, bis sie (einschließlich der Normdaten) vollständig katalogisiert sind. Da andere Bibliotheken auf die Daten der Amerikaner aufbauen, ergibt sich ein Dominoeffekt. BTW: Brauchen wir die beiden Listen Benutzer:APPER/PNDfehlt/2 und Benutzer:APPER/Tn noch oder können sie aus der Wartungskat gestrichen werden? Die Gymel-Listen sind aktueller. --Kolja21 (Diskussion) 22:54, 22. Sep. 2012 (CEST)

Der zugrundeliegende Dump der GND im Turtle-Format wurde Ende Juli bereitgestellt, inhaltlich ist sein Stand April 2012. Angekündigt ist, die komplette GND mehrmals jährlich zum Download bereitzustellen, wer es aktueller (z.B. absolut live) haben will, kann seit einigen Jahren alle Änderungen über OAI- oder SRU-Schnittstellen abgreifen, die sind zwar nicht anonym, sondern erfordern Registrierung, sind aber ebenfalls kostenfrei. Die GND ist erst seit dem 1. Juli unter CC0, vorher durften wir solche Dumps nicht unbedingt ausschlachten, in Zukunft werden die Dumps wohl zum Zeitpunkt ihrer Bereitstellung wesentlich aktueller sein und wenn wir sie zeitnah in Wartungslisten verwursten, ist doch alles prima, oder? -- Thomas Berger (Diskussion) 23:17, 22. Sep. 2012 (CEST)

Die Listen sind auf jeden Fall eine riesen Hilfe, was die Qualität und Verlinkung der Wikipediaartikel angeht. --Kolja21 (Diskussion) 23:25, 22. Sep. 2012 (CEST)

LCCNs von 2012

Weiß eigentlich jemand warum die LCCNs von 2012 nicht funktionieren - bsp. bei Bob Bowen oder bei Georg L. Sarauw? Grüße, --Wissling (Diskussion) 10:36, 23. Dez. 2012 (CET)

Gab es dieses Jahr schon einmal: Das von VIF verlinkte id.loc.gov zeigt sie unter der Nummer, in authorities.loc.gov sind sie suchbar, aber der dort angegebene Link auf lccn.loc.gov (der auch hier genutzt wird) bringt den Fehler. Sollte sich innerhalb von Tagen oder Wochen von selbst regeln. -- Thomas Berger (Diskussion) 11:18, 23. Dez. 2012 (CET)

Ok, der Fehler ist offenbar behoben... Grüße, --Wissling (Diskussion) 10:26, 19. Jan. 2013 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: Wissling (Diskussion) 10:26, 19. Jan. 2013 (CET)

Extended VIAF

Was um Himmels willen ist denn das? http://viaf.org/viaf/183447636 --FA2010 (Diskussion) 20:56, 13. Aug. 2012 (CEST)

Hier scheint es ein paar Infos dazu zu geben. --Kam Solusar (Diskussion) 00:54, 14. Aug. 2012 (CEST)
Sonderlich von Erfolg gekrönt scheint das Konzept aber nicht zu sein. Infolge meiner E-Mail hat man einen xA-Eintrag für die Katalanistin Jenny Brumme (http://viaf.org/hosted/xa/1285/) angelegt. Er ist zwar in VIAF integriert (http://viaf.org/viaf/46848960), aber die im xA-Datensatz ebenfalls genannten Datensätze der deutschen, dänischen und polnischen Nationalbibliothek (http://viaf.org/viaf/232807344) bilden noch immer ein eigenes Cluster. --Monsieur Becker (Diskussion) 07:58, 14. Aug. 2012 (CEST)
Das könnte sich noch ändern in der nächsten Matching-Runde (die Ende dieses Monats stattfinden dürfte). Ist jetzt spekulativ, aber die VIAF-Algorithmen brauchen eine gewisse Trägheit, um sicherzustellen, dass Cluster-IDs einigermaßen permanent bleiben. Da könnte es genau im Plan liegen, dass der neue xA-Datensatz zunächst dem größeren der beiden Jenny-Brumme-Cluster zugeordnet wurde. Entsprechend verstärkt könnte dieser nun noch "anziehendere" (frei assoziiert "attraktivere") Cluster im nächsten Schritt die restlichen Datensätze (DNB, Dänemark, Polen) aufnehmen. – Ohne diese Trägheit wäre um den xA-Datensatz vielleicht ein komplett neuer Cluster entstanden, der die zwei bisherigen Jenny-Brumme-Cluster ersetzt hätte.
Mal schauen, ob sich tatsächlich noch etwas bewegt ... -- Make (Diskussion) 11:35, 14. Aug. 2012 (CEST)
Aktualisierung: Bei der Matching-Runde Ende September ist http://viaf.org/viaf/232807344 jetzt im größeren Cluster aufgegangen. -- Make (Diskussion) 18:24, 6. Okt. 2012 (CEST)

GND die zwei Personen vermischt

Frage was macht man bei Fällen wo eine individualisierte GND komplett zwei unterschiedliche Personen beschreibt, konkret 119450984? Dort werden zwei Priester gleichen Namens (João Rodrigues), mit ähnlichen Lebensdaten und gleichem Wirkungsort (Japan) als eine Person behandelt. Nachfolgend eine Aufschlüsselung der Vermischung:

Feld João Rodrigues, gen. Tçuzzu João Rodrigues, gen. Girão/Giram
Andere Namen Rodriguez Tsuzu, Juan; Rodrigues Tçuzzu, João; Tçuzu, João; Tçuzu, João Rodrigues; Rodrigues Tçuzu, João Rodriguez, Giram; Rodriguez, Giron; Rodriguez, Girao; Rodriguez, Roiz; Rodrigues Girão, João; Girão, João Rodrigues; Rodrigues-Girão, João; Rodriguez, João; Roiz Giram, Giovanni; …
Beruf(e) Kartograph; Jesuit; Übersetzer; Missionar Jesuit (?); Missionar
Zeit Todesjahr evtl. 1633 oder 1634 [Anm. meinerseits: er wurde 1561/2 geboren] Lebensdaten: 1558-1629
Autor von Arte da lingoa de Iapam

--Mps、かみまみたDisk. 12:50, 29. Sep. 2012 (CEST)

Das sollte man genau so in aller Ausführlichkeit (möglichst mit Quellen) bei der DNB melden. Dafür gibt es bei jedem GND-Datensatz einen Link rechts "Korrekturanfrage". --AndreasPraefcke (Diskussion) 16:20, 29. Sep. 2012 (CEST)

Neues Tool & Bot

Ich habe eine neue Version eines Normdaten-Tools gebaut, nach dem englischen Authority Control genannt. Besonderheiten:

  • Funktioniert (bisher) für de, en, und fr; weitere möglich
  • Kandidatenliste mit Biographien ohne {{Normdaten}} bzw. {{Authority control}} wird im Hintergrund jeden Tag/alle paar Tage aktualisiert
  • Tool durchsucht VIAF und DNB, und guckt in anderen Wikipedia-Sprachen (de, en, fr) nach Normdaten
  • Bearbeiten unter eigenem Namen mit vor-ausgefülltem Text, oder vollautomatisch via Bot (unter "Optionen") nach TUSC-login (bot-flag ist beantragt; siehe auch Benutzer Diskussion:AuCoBot)

Bugs und feature requests am besten auf der Bot-Diskussionsseite (oder auf meiner). --Magnus Manske (Diskussion) 15:42, 1. Okt. 2012 (CEST)

Klingt spannend. Kannst du das Tool für Nicht-Techniker etwas genauer erklären? Wenn ich es richtig verstehe, macht toolserver.org/~magnus/ts2/authority_control/ Vorschläge für Normdateneinträge, die allerdings intellektuell überprüft werden müssen. Beispiel:
Bert Wollersheim (* 24. März 1951 in Bonn) ist ein deutscher Bordellbetreiber.
Vorschlag: DNB: 129184020 / Wollersheim, Bert / Lebensdaten: 1947- / Journalist, Autor, Berufsberater
Wie hoch ist die Trefferquote? Wäre es nicht sinnvoll, neben den Namen auch die Lebensdaten abzugleichen? --Kolja21 (Diskussion) 17:37, 1. Okt. 2012 (CEST)
Lebensdaten sind in DNB/VIAF oft unvollständig oder (leicht) falsch; das würde zu viele gute Treffer "verstecken". Wenn der WP-Artikel Lebensdaten hat, werden die entsprechenden Jahreszahlen in den DNB/VIAF-Treffern fett dargestellt, und die entsprechenden Einträge an den Anfang der jeweiligen Liste geschoben. Über den Daumen gepeilt, hat ca. jeder dritte Artikel einen Treffer, YMMV. --Magnus Manske (Diskussion) 18:14, 1. Okt. 2012 (CEST)
Was macht das Tool denn anders/mehr als Schnarks Personendaten- & Normdatenskript, mit dem ich seit einiger Zeit arbeite und gut zurechtkomme? --Schwäbin 18:23, 1. Okt. 2012 (CEST)

Ich sehe das Tool eher als Ergänzung zu den Wartungslisten - oder? --Kolja21 (Diskussion) 18:26, 1. Okt. 2012 (CEST)

AFAIK bearbeitet Schnarks Tool vorhandene Normdaten; zumindest arbeitet es "nur" auf dem aktuellen Artikel, nicht systematisch eine Liste runter. Die Wartungslisten zeigen, was mal war; zahlreiche Treffer in meinem Tool verraten wir jedenfalls, dass sie nicht grade den aktuellen Stand in DNB/VIAF widerspiegeln. --Magnus Manske (Diskussion) 19:52, 1. Okt. 2012 (CEST)
Das neue Tool zeigt Kontext, also Lebensdaten, Berufe etc., etwa in dem Umfang wie die Kurzlisten von VIAF und DNB-Portal. Das ist also schon deutlich mehr als normdaten.js (oder das Vorgängertool). Dafür ist der Suchalgorithmus, mindestens im Fall von Klammerlemmas, derzeit noch komplett unbrauchbar ;-). Defizite sehe ich derzeit bei der Unterstützung der Wartungsfunktionen, d.h. etwa Kennzeichnung von Tn-Sätzen im VIAF-Cluster und Eintragen von GNDName, GNDfehlt und GNDCheck-Parametern. Der Status Tn/Tp laesst sich seit einiger Zeit auch legal & live ermitteln, zumindest bei Personen: "http://d-nb.info/gnd/110575628 is a gnd:UndifferentiatedPerson". -- Thomas Berger (Diskussion) 20:36, 1. Okt. 2012 (CEST)
Externe Suchen lassen die Klammern weg, sollte also kein Problem sein (höchstens zu viele Treffer). Suchergebnisse für GND zeigen nur Personen-Einträge, keine undifferenzierten Namen. --Magnus Manske (Diskussion) 21:12, 1. Okt. 2012 (CEST)
Ich hatte vorhin vom Tool Wilhelm Heinrich (Nassau-Usingen) präsentiert bekommen und auf den vorderen Rängen der VIAF-Vorschläge waren B.Traven, Alexander von Humboldt, Lucius Annaeus Florus und Johann Sebastian Bach... (anscheinend die ersten der 2473 Treffer bei der Suche nach "Wilhelm Heinrich" ohne alles), bei den GND-Vorschlägen Abbeg, Abeken, Abel, Abich, ... Jedenfalls war es unmöglich herauszufinden, dass es wirklich nichts zutreffendes gibt. Geburtsjahre sind bei solchen Personen sehr wichtig, das mit der Unschärfe stimmt natürlich, evtl. hilft es einfach, den konkreten Suchbegriff anzuzeigen und vom Benutzer modifizieren zu lassen (manchmal ist Weglassen von Vornamen unumgänglich und bei Namen aus ursprünglich kyrillischer Schreibung stehen sie hier durchgehend in einer Form, wie sie keine Bibliothek auch nur als Verweisungsform aufnimmt, haben also fast generell keine VIAF- oder GND-Treffer, obwohl Datensätze durchaus vorhanden sind). Ein harmloseres Beispiel war Georg Zimmermann, das Tool zeigt bei der GND 9 der ersten Ergebnisseite mit 10 Treffern, da diese neuerdings alphabetisch sortiert sind, waren die aussichtreichen Kandidaten unter "Zimmermann" gar nicht dabei...
Ein typischer Fall ist Hermann Winterling, das Tool sagt "No DNB results", dabei beruht der VIAF-Eintrag auf einem GND-Tn-Satz, der überdies ein aussichstreicher Kandidat für Individualisierung ist: Wenn da nicht wenigstens "GNDfehlt" eingetragen wird, landet der Satz gar nicht in den Wartungskategorien.... Eine sehr häufige Variante davon ist Michael Worbs: Das Haupt-VIAF-Cluster enthält den GND-Tn-Eintrag mit Literatur in der DNB, das andere Cluster enthält nur den Tp-Eintrag ohne Literatur in der DNB. Auch hier sollte m.E. die Tn-Nummer bei Übernahme der VIAF-Daten mit eingetragen werden. -- Thomas Berger (Diskussion) 22:13, 1. Okt. 2012 (CEST)

Die dt. Normdaten-Vorlage unterstützt BNF nicht. Bitte nicht per Tool überall eintragen. --FA2010 (Diskussion) 18:04, 3. Okt. 2012 (CEST)

GND Geographika

Täuscht mich mein Eindruck oder ist das Dubletten-Chaos bei Geographika wirklich größer als bei Personen? --Mai-Sachme (Diskussion) 18:29, 3. Okt. 2012 (CEST)

Für viele Orte bspw. dürfte es sowohl in der SWD als auch in der GKD Einträge gegeben haben. Nachdem diese beiden jetzt mit der PND zu einem großen Topf zusammengeworfen wurden, sind Dubletten bis zu einer Bereinigung unvermeidlich. -- Rosenzweig δ 18:42, 3. Okt. 2012 (CEST)

VIAFbot

Der en:User:VIAFbot hat gestern richtig losgelegt. --Mai-Sachme (Diskussion) 10:39, 5. Okt. 2012 (CEST)

Danke für den Hinweis. Spannend die Entwicklung zu verfolgen. --Kolja21 (Diskussion) 11:25, 6. Okt. 2012 (CEST)
Sehe ich es richtig, dass nur die VIAF eingefügt wird, nicht aber GND oder LCCN? --Monsieur Becker (Diskussion) 23:03, 6. Okt. 2012 (CEST)
Korrekt, der Bot beschränkt sich auf die VIAF. Die VIAF hat ihrerseits damit begonnen, in ihrer Testversion auf die englische Wikipedia zu verlinken. In dem Beispiel test.VIAF 108179854 ist übrigens die individualisierte GND gegen eine nicht-individualisierte ausgetauscht worden (jetzt als Dublette unter test.VIAF 89088004), was zeigt, wie instabil die Metadaten sind. --Kolja21 (Diskussion) 00:55, 7. Okt. 2012 (CEST)
Welchen Stellenwert hat die Testversion? Gibt sie eine Vorschau auf das nächste Update? --Monsieur Becker (Diskussion) 12:58, 7. Okt. 2012 (CEST)
Die letzte Testversion von Ende September entsprach, soweit meine Stichprobe reichen, der aktuellen offiziellen Version, war also quasi eine Vorschau. Das muss aber nicht die Regel rein. (Test und Veröffentlichung lagen zeitlich nah beieinander.) --Kolja21 (Diskussion) 13:32, 7. Okt. 2012 (CEST)

Der Bot macht es sich offenbar zu einfach: Er vergleicht Lebensdaten + Namen, und schon hat er die falsche Person erwischt. Beispiel: Peter Abrahams (American author), ein Krimiautor, der so zum Verfasser von medizinischer Fachliteratur wurde. Mit einem Blick in die deutschsprachige Wikipedia, Peter Abrahams (US-amerikanischer Autor), hätte der Fehler vermieden werden können. --Kolja21 (Diskussion) 20:50, 9. Okt. 2012 (CEST)

Ja, habe bei Stichproben auch schon eine fehlerhafte Zuordnung entdeckt: en:John Miller (linebacker). Sollten wir den Kollegen mal mitteilen, aber es ist fraglich, ob sie das überhaupt tacklen können/wollen. Das Projekt ist ja aufgrund eines fehlenden Normdaten-Teams (wie es sich hier immerhin in kleinem Umfang gebildet hat) von Grund auf auf automatisiertes Einfügen ausgerichtet. Ob die wirklich vorhaben zu "Handarbeit" überzugehen?
Na gut, man könnte ihnen mal auf jeden Fall zwei Sachen raten: a) bei Divergenzen zu auf de.wikipedia eingetragenen VIAF-Nummern einen Kontrolldurchgang einzuschieben, b) aufgrund der Erfahrungen beim Abarbeiten von Benutzer:Gymel/VIAF-Zuordnungen Personen, die in Sportler-Kategorien eingetragen sind, ebenfalls bis zur "intellektuellen" Durchsicht zurückzustellen. Habt ihr noch mehr an Operationalisierbarem? --Mai-Sachme (Diskussion) 21:18, 9. Okt. 2012 (CEST)

Ich finde, dass die engl. Wikipedia generell zu sehr auf Bots setzt. (Die Dikussionsseiten leuchten beispielsweise immer blau, da gleich zur Begrüßung ein Standardtext reinkopiert wird, was dazu führt, dass ich sie gar nicht erst aufrufe.) Was den VIAFbot betrifft, habe ich schon eine Rückmeldung erhalten: "... the bot should be checking the German records as it goes along." Also besteht noch Hoffnung ;) --Kolja21 (Diskussion) 21:36, 9. Okt. 2012 (CEST)

Inzwischen gibt es eine eigene Seite für Problemmeldungen: en:Wikipedia:VIAF/errors. Laut Beschreibung ist die Liste aber nur für Lemmata gadacht, die durch den VIAFbot mit einem falschen VIAF-Cluster identifiziert wurden (keine allgemeine VIAF-Fehlerseite) -- Make (Diskussion) 15:55, 10. Okt. 2012 (CEST)

NDL sichtbar in VIAF

Datensätze der NDL werden schon seit einiger Zeit ([34]) in die VIAF integriert, doch erst seit dem letzten Update sind sie auch öffentlich sichtbar (zumindest waren sie mir vorher nicht aufgefallen). Gibt es eine Möglichkeit, eine Wartungsliste mit Seiten zu erstellen, die in der dt. Wikipedia zwar einen VIAF-Eintrag haben, jedoch nicht den entsprechenden NDL-Verweis? --Monsieur Becker (Diskussion) 16:38, 7. Okt. 2012 (CEST)

Naja, bevor wir jetzt x Artikel mit sowieso VIAF-integrierten NDL-Nummern fluten, würde ich schon gerne genauer wissen, welchen Sinn das haben soll? LCCN ist ja ein internationaler Referenzpunkt (etwa für WorldCat), GND ist für unser Zielpublikum (deutscher Sprachraum) und durch das Apper-Tool sicher sinnvoll, aber NDL? Da habe ich bisher nur sehr vage Begründungen gelesen ("internationaler", "bietet andere Perspektive im Vergleich zu unseren westlichen Normdaten"). Das ganze hat mich schon bei der Einführung etwas gewundert und ist seit kurzem noch schlechter "erklärbar". Ich denke, wir tun uns selbst keinen Gefallen bezüglich projektinterner Zustimmung und Akzeptanz zum Normdatenprojekt (beides ohnehin auf etwas wackligen Beinen), wenn wir im Artikel für gar nichts verwendete Zahlenreihen abladen. Haben wir irgendeine Ahnung, ob die NDL perspektivisch für irgendetwas nutzbar ist, und ob das den Aufwand rechtfertigt, wenn wir sie ohnehin schon per VIAF haben? --Mai-Sachme (Diskussion) 16:57, 7. Okt. 2012 (CEST)

Hallo Mai-Sachme, ich finde die NDL hat sich bewährt, da sie einen anderen Kulturraum erschließt. Falls sie demnächst regulär über VIAF angezeigt werden sollte (zzt. gibt es ja nur eine Testeinspielung), würde ich sie daher nicht gleich über Bord werfen. Die von Monsieurbecker angeregte Liste kann auf jeden Fall nicht schaden, auch im Hinblick darauf, dass die VIAF alles andere als perfekt ist. --Kolja21 (Diskussion) 18:16, 7. Okt. 2012 (CEST)

Hallo Kolja, auch da sie einen anderen Kulturraum erschließt empfinde ich wiederum als sehr vage/sehr unkonkret und klingt für mich (no offense intended) nach etwas willkürlichem "Exotenbonus" :-) Inwiefern hat sich die NDL denn bewährt? VIAF bietet ja auch andere geographisch und thematisch Neuland erschließende Normdaten (Israel, Bibliotheca Alexandrina, Getty-Datenbank). Es geht mir hier ja nicht konkret darum, etwas unbedingt rauszukegeln, aber ich würde eben den aktuellen Aufwind für dieses Projekt nicht durch für Externe unverständlichen und intern nicht nutzbaren Datenballast gefährden, der unserer Vorlage, die manchen ohnehin schon recht mysteriös erscheint, weiter aufbläht. --Mai-Sachme (Diskussion) 18:30, 7. Okt. 2012 (CEST)

Hallo Mai-Sachme, "Exotenbonus" (im pos. Sinne) ja, "willkürlich" nein, denn es gab, als wir die Auswahl getroffen haben, keine andere vergleichsweise bedeutende nicht-lateinische Normdatenbank, die dazu noch frei verfügbar und leicht abfragbar ist. Mit VIAF kannst du die NDL nicht vergleichen, denn VIAF ist "nur" eine Metadatenbank, die die originalen Normdateien automatisiert (und mit entsprechenden Fehlern behaftet) unter einer neuen Nr. zusammenfasst. --Kolja21 (Diskussion) 20:08, 7. Okt. 2012 (CEST)

Wir haben allerdings damals mit ebendieser Begründung (steht ja in VIAF) SELIBR rausgeworfen und BNF und SUDOC gar nicht erst aufgenommen... Das war vielleicht tatsächlich etwas kurzsichtig (nicht SELIBR, das ist wirklich sehr gut in VIAF verknüpft und hat so gut wie keine isolierten Datensätze dort, aber z. B. die BNF). --FA2010 (Diskussion) 09:23, 9. Okt. 2012 (CEST)
Der Nachteil bei der SELIBR war, dass sie weder von der schwedischen Wikipedia benutzt wird, noch - und das ist für mich der entscheidende Punkt - unabhängig recherchierbar ist. Ich muss in der VIAF nachschlagen, um die SELIBR zu bekommen; daher ist ihr Eintrag entbehrlich. BNF und SUDOC hätten wir nicht rausgeworfen, aber für eine Neuaufnahme waren die Web NDL Authorities ergiebiger, weil sie den asiatischen Raum erschließen und nicht in der VIAF erfasst waren. --Kolja21 (Diskussion) 15:00, 9. Okt. 2012 (CEST)
Ich habe einige zentrale Figuren Japans in der japanischen Wikipedia nachgeschlagen und dort keine Einbindung der NDL festgestellt. Außerdem hatten all jene Personen auch GND und LCCN, sodass die NDL in der deutschen Wikipedia in der Regel keinen Mehrwert darstellt. Okay, einige Nur-NDL-er wird es vermutlich auch geben, doch wie viele sind es tatsächlich, die dazu noch den Relevanzkriterien der dt. Wikipedia entsprechen? --Monsieur Becker (Diskussion) 23:27, 9. Okt. 2012 (CEST)
Schaden tut die NDL jedenfalls nicht, und mit Wikidata wird sich ohnehin langfristig sicherlich einiges ändern in der Art, wie wir Normdaten verwalten. --FA2010 (Diskussion) 10:41, 10. Okt. 2012 (CEST)
Schaden würden auch BNF, BNE (Spanien) und andere Normdateien nicht. Sie wurden allerdings nicht aufgenommen, da sie bereits in der VIAF vertreten sind und keinen neuen Kulturraum erschlössen (mal abgesehen vom französischsprachigen Afrika und Südamerika). Das Argument des Bereits-vertreten-Seins gilt nun auch für die NDL. Im Übrigen ist es für mich wenig nachvollziehbar, dass immer betont wird, dass VIAF ja nur ein Metaangebot sei und wir uns darauf nicht verlassen sollten, wenn es aber etwa um SELIBR geht, ist die VIAF wieder völlig okay. Vielleicht sollten wir in Vorbereitung auf Wikidata über ein nicht automatisch generiertes »Konkurrenz«-Angebot zur VIAF nachdenken. --Monsieur Becker (Diskussion) 11:18, 10. Okt. 2012 (CEST)
„Das Argument des Bereits-vertreten-Seins gilt nun auch für die NDL.“: Das stimmt nur bedingt, da alle Datensätze als "Japan (NDL)-test" mit Warnsymbol versehen sind, scheint dass momentan noch kein tatsächlicher Produktiveinsatz zu sein. --Mps、かみまみたDisk. 17:28, 10. Okt. 2012 (CEST)
@Monsieur Becker: Der springende Punkt ist, wo wir die Daten abfragen können. Die Quellen für GND, LCCN, NDL und SUDOC sind deren Webseiten, d.h. wir kommen an die Originaldaten. VIAF ist nur die Zweitverwertung. (In der Literaturwisschaft würde man sagen, VIAF ist in diesem Fall nicht zitierfähig, da es eine bessere Quelle gibt.) Für SELIBR gibt es - bislang - keine Webseite. Wir können sie nur über den Umweg über die VIAF recherchieren. (Anderes gesagt: Die SELIBR, die wir recherchieren, ist immer die VIAF-SELIBR, während wir beispielsweise in den Normdaten GNDs verlinkt haben, die erst im August vergeben wurden und in der VIAF-Datenbank noch gar nicht erfasst sind.) --Kolja21 (Diskussion) 20:53, 10. Okt. 2012 (CEST)
Ich kann Mps nur zustimmen: Die NDL-Einspielung in VIAF ist vorerst nur ein Test, also kein Grund, sie gleich über Bord zu werfen. Die Frage ist eher, ob es Normdaten gibt, die wir noch aufnehmen sollten. Aus dem franz. Sprachraum bieten sich drei an: BnF, SUDOC und RERO. Welche davon ist am geeignetsten für unsere Zwecke? (BnF und SODOC werden auch in der franz. Wikipedia genutzt.) --Kolja21 (Diskussion) 21:13, 10. Okt. 2012 (CEST)
Das Warnsymbol hinter den NDL Authorities ist mittlerweile weg, die Testphase scheint also abgeschlossen... Grüße, --Wissling (Diskussion) 13:28, 16. Okt. 2012 (CEST)
Ist mir auch aufgefallen. Das Symbol wurde heute geändert, die Daten sind aber noch die alten. --Kolja21 (Diskussion) 15:06, 16. Okt. 2012 (CEST)

neue Arbeitsliste

Hallo, Max Klein hat freundlicherweise eine Liste von Artikeln veröffentlicht, bei denen im Rahmen der VIAF-Zuordnung Unstimmigkeiten aufgetreten sind: en:User:VIAFbot/Conflict6/0 (Fall 1 dürfte wohl der häufigste sein: veraltete VIAF-Nummer bei uns). Wir müssten uns noch überlegen, wie wir am besten eine Abarbeitung markieren. --Mai-Sachme (Diskussion) 21:08, 10. Okt. 2012 (CEST)

Gutes Hilfsmittel! Erl. Einträge streiche ich durch. (Falls das stört, können wir die Liste auch kopieren, in die Kategorie:Wikipedia:Normdaten-Wartung aufnehmen und wie gewohnt abarbeiten.) --Kolja21 (Diskussion) 21:32, 10. Okt. 2012 (CEST)
Mein Vorschlag als Alternative zum Durchstreichen wäre ein Kürzel am Beginn der jeweiligen Zeile – das hat sich bei Abarbeitung der Fehlermeldungen an de DNB bewährt. Bin noch etwas unentschieden, was eine gute Systematik wäre. VIelleicht "+" für echte Fehler und "-" für Pseudo-Fehler (damit meine ich veraltete VIAF-Nummern: Die führen ja immer noch zum richtigen Cluster. Müsste man besprechen, ob die überhaupt aktualisiert werden sollten).
Sowieso habe ich an der bereitgestellten Liste noch ein paar Unstimmigkeiten gefunden: Stellenweise scheint mitten in einer Zeile Text verlorengegangen zu sein und es gibt Blöcke mit Duplikaten. Ich hab das auf der Diskseite des VIAF-Bots erstmal angemerkt: en:User_talk:VIAFbot#analysis_of_conflicts Scheint mir sinnvoll, diese Probleme erst abzustellen, bevor man eine solche Liste abarbeitet. -- Make (Diskussion) 15:48, 12. Okt. 2012 (CEST)
Als Hilfestellung böte sich vielleicht mein Bot-Interface an, das auch bei vorhandenen Einträgen sucht (aber nicht per Bot bearbeitet). --Magnus Manske (Diskussion) 00:31, 17. Okt. 2012 (CEST)

Parameter "WP"

Mir sind vorhin zwei Artikel aufgefallen, die noch den veralteten Parameter "WP" in den Normdaten eingetragen hatten. Offenbar wird dieser Parameter von dem Tool Fehlerhafte Parameter der Vorlage:Normdaten nicht erfasst. Weiß jemand bzw. kann anhand des Dumps nachprüfen, um wie viele Artikel es sich handelt? --Kolja21 (Diskussion) 06:15, 12. Okt. 2012 (CEST)

Da der Parameter nicht ausgewertet wird, ist es eigentlich egal. --FA2010 (Diskussion) 10:17, 12. Okt. 2012 (CEST)
Ronnie Urini, Devon (Pornodarstellerin), Mattathias, (Hans-Peter Wild), Léonie-Claire Breinersdorfer, Hartwig Freiesleben, (Vorlage:Normdaten/Doku), Lukáš Hurník, Hans Rueber zu Pixendorf, Christian Hornberger, Gerhard Oesten, Waltraud Schmidt-Sibeth, Nikolaus Asenbeck, Karl Häußler, Manfred Humbs, Roland-Friedrich Messner, Simon (Hasmonäer), Frederick Schwatka, Johannes Korndörfer, dazu noch eine halbe Tonne Artikel mit WP=0. --Schnark 09:38, 13. Okt. 2012 (CEST)

Super. Danke für die Auskunft! --Kolja21 (Diskussion) 18:18, 13. Okt. 2012 (CEST)

Die kleine Liste (WP=1) ist jetzt abgearbeitet. --Kolja21 (Diskussion) 19:02, 13. Okt. 2012 (CEST)
Dann könnte man eigentlich auch die Behandlung dieses Parameters in Vorlage:Normdaten entfernen, oder? Die Liste war zum Zeitpunkt der Erstellung fast tagesaktuell, dass in der Zwischenzeit neue Verwendungen ohne TYP=p dazugekommen sind, halte ich für unwahrscheinlich. --Schnark 11:11, 15. Okt. 2012 (CEST)
Ja, das könnte man jetzt wirklich. --FA2010 (Diskussion) 11:30, 15. Okt. 2012 (CEST)
Hab eben (erfolglos) versucht, den Parameter "WP" aus der Vorlage rauszuwerden. Da muss ein Quellcode-Profi ran ;) PS: @Schnark: Wie groß ist "eine halbe Tonne Artikel". Hast du die genaue Zahl? --Kolja21 (Diskussion) 14:12, 15. Okt. 2012 (CEST)
Im letzten Dump waren es 69, dabei etwa Catwoman (Comicfigur), Päpstin Johanna oder Elverfeldt genannt von Beverfoerde zu Werries (Adelsgeschlecht), also tatsächlich Fälle, wofür WP=0 einmal erfunden wurde (nämlich um den Bereich der Normdaten-TYP "p" auszugrenzen, die mangels oder wegen umstrittener Vorlage:Personendaten möglicherweise nicht in der APPER-Personensuche auftauchen). -- Thomas Berger (Diskussion) 15:58, 15. Okt. 2012 (CEST)
Ja, aber die BEACON-Funktionalität der Personensuche funktioniert jetzt m. W. auch für diese. --FA2010 (Diskussion) 16:13, 15. Okt. 2012 (CEST)
Bei dem Adelsgeschlecht habe ich als Vermerk: "GND-Typ: Familie (pif)" eingetragen, damit der Eintrag "Normdaten (Person)" nicht gelöscht wird.[35] --Kolja21 (Diskussion) 16:44, 15. Okt. 2012 (CEST)
Ist eigentlich nicht nötig, in unserer Hilfe steht deutlich dabei "p für Personen oder Familien" (und es gibt auch schon hunderte Familienartikel mit GND Typ p) --FA2010 (Diskussion) 17:20, 15. Okt. 2012 (CEST)
@FA2010: Natürlich hast du völlig recht, und wenn man einen Zusatz für pif einführt, sollte man ihn auch bei allen verwenden; trotzdem fiel es mir schwer, eine Familie (hätte die DNB mich gefragt, hätte ich, wie für eine Band, Typ k vorgeschlagen) als Einzelperson einzutragen. (Hab den Parameter REMARK wieder rausgenommen.) --Kolja21 (Diskussion) 17:57, 15. Okt. 2012 (CEST)
@alle vorigen: Ja, die WP-Personensuche funktioniert, ist also nicht mehr an die Personendaten-Vorlage gekoppelt. Persönlich bin ich durchaus zufrieden damit, dass dieser Schlenker des "WP"-Kennzeichnens von eigentlich-nicht-aber-irgendwie-doch-oder-zumindest-vergleichbar-Personen nicht mehr weitergeführt wird. Dennoch haben diese Randbereiche stets ein Irritations- und Konfliktpotential (warum hat Päpstin Johanna keine Personendaten, warum ist sie per Kategorisierung zwar Person, aber hat kein Geschlecht? Daran zu drehen dürfte sofort alle möglichen Reverts und Grundsatzdiskussionen nach sich ziehen) Und sowohl in en:WP als auch bei amerikanischen Bibliothekaren hat man weniger Probleme mit bibliographischen Entitäten (also sich quasi verselbsständigt habenden Pseudonymen) als hier, dafür aber größere Schwierigkeiten, sich fiktive Personen als Normeintrag vorzustellen... VIAF, das Interwiki-System und wohl auch WikiData müssen diese Spannungen aushalten, und weil in dem Bereich sowieso niemand Recht haben kann wird sich das m.E. langfristig einander annähern, und wenn auch nur durch Ermüdung. Momentan halte ich es eigentlich für keine schlechte Idee, fallweise mittels einer Bemerkung in der Normdatenvorlage der Situation vorzubeugen, dass jemand sich bemüßigt fühlt mit Hinweis auf angeblich "fehlerhafte" Konzepte der Normdatei(en) die Normdaten wieder auszutragen. -- Thomas Berger (Diskussion) 20:12, 15. Okt. 2012 (CEST)
Wenn der Toolserver mitspielt, kann man die Liste der WP=0-Artikel auch hier einsehen, allerdings vermutlich nicht ganz aktuell. An der Vorlage versuche ich mich gleich, ich habe inzwischen eine brauchbare Syntaxhervorhebung, da finde ich mich hoffentlich im Klammergewirr etwas leichter zurecht. Und eine „echte“ Person ist jeder, der von der Kirche anerkannt wird. Deswegen hat Johanna keine, wohl aber Christophorus. --Schnark 09:40, 16. Okt. 2012 (CEST)
Sieht so aus, als wäre meine Änderung an der Vorlage fehlerfrei. --Schnark 09:48, 16. Okt. 2012 (CEST)
Ja. Und sobald Kategorie:Wikipedia:Normdaten-TYP fehlt leer ist, will ich das alles eh nochmal etwas entschlacken. --AndreasPraefcke (Diskussion) 10:09, 16. Okt. 2012 (CEST)
Danke! Die Arbeit hat sich gelohnt. Mit jedem (veralteten) Parameter weniger, wird die Vorlage übersichtlicher, was vor allem für die zahlreichen Sprachversionen hilfreich ist, in denen sich die GND erst nach und nach durchgesetzt hat. In der französischsprachigen Wikipedia haben die Normdaten übrigens heute ihren Sonderstatus verloren, und sie sehen demnächst aus, wie reguläre Weblinks. Wo sie im Artikel positioniert werden sollen, darüber wird gerade abgestimmt. --Kolja21 (Diskussion) 15:35, 16. Okt. 2012 (CEST)

Kleiner Meilenstein: über 100.000 GND-Einträge

Laut Vorlage:NORMDATENCOUNT haben wir nun schon 101.265 Einträge als GND, während nur noch 118.425 als PND eingetragen sind. Das "schleichende" Verfahren ohne den großen Botlauf scheint bislang ganz gut zu funktionieren. --FA2010 (Diskussion) 09:50, 3. Dez. 2012 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: APPER\☺☹ 01:20, 22. Feb. 2013 (CET)


GND ohne zugehörigen VIAF-Eintrag

Im Artikel Anne von Perusse d’Escars hatte ich die Vorlage Normdaten mit VIAF-ID eingetragen, die auf SUDOC verweist. Ein Eintrag der DNB ist über VIAF bisher nicht zu ermitteln. Als Ergebnis von GNDfehlt wurde heute eine GND (GND=1023187078) eingetragen, zu der es keine VIAF-ID gibt (aber den SUDOC-Eintrag bei VIAF nennt die DNB unter Quellen). Es besteht also ein Konflikt zwischen VIAF und GND, was aber auch sonst vorkommen könnte, denn nicht immer ist die personalisierte GND bei VIAF sinnvoll verknüpft, und eine nicht mit dem GND-Eintrag verknüpfte VIAF-ID kann bisweilen weiterführende Informationen liefern, etwa LCCN. Hier besteht eigentlich Klärungsbedarf. --Enzian44 (Diskussion) 21:10, 24. Okt. 2012 (CEST)

Hallo Enzian, du schreibst korrekt "bisher nicht zu ermitteln". Der GND-Datensatz stammt vom 12. Juni. Die VIAF wurde seitdem zwar schon (teilweise) aktualiert, aber nur die LCCN und die tschechischen Daten sind auf dem neuesten Stand. Gruß --Kolja21 (Diskussion) 21:38, 24. Okt. 2012 (CEST)
Wir nehmen die individualisierte GND, egal was VIAF dazu sagt. Und die beste VIAF-ID, egal, welche GND drinsteckt. --FA2010 (Diskussion) 21:39, 24. Okt. 2012 (CEST)
Die beste? Theoriefindung :-) --Enzian44 (Diskussion) 23:45, 24. Okt. 2012 (CEST)

Englische Wikipedia jetzt in VIAF gelistet

Gerade zum ersten Mal gesehen: [36]. Die englische Wikipedia wird jetzt nicht mehr nur als bloßer weiterführender Link, sondern testweise zusammen mit den anderen Normdateien angezeigt.

Die beiden Werke, die im Abschnitt "Ausgewählte Titel" mit einem Wikipedia-Icon gelistet sind, stehen im Artikel en:Clemens von Zimmermann allerdings nur im Fließtext. Wurden die in VIAF da von Hand eingetragen? --Kam Solusar (Diskussion) 22:39, 6. Nov. 2012 (CET)

Ich dachte erst, dass das vielleicht irgendwie von DBPedia extrahiert wurde, aber da gibt's bei C.v.Z. kein solches Feld. Also kommt das einfach aus dem Fließtext, nur weil's kursiv ist? Das könnte bei den meisten Artikeln gewaltig schief gehen. --FA2010 (Diskussion) 22:49, 6. Nov. 2012 (CET)

Bei der VIAF läuft nichts manuel, deswegen gleichen die Datensätze auch einem Verschiebebahnhof. Dass mit den Werktiteln ist mir noch nicht aufgefallen; ein spannender Hinweis. Vor allem überrascht mich, dass sie nicht auf Nr.-Sicher gehen und auf die Normdatenvorlage zurückgreifen, sondern anscheinend das Feld "Persondata" (Vorlage:Personendaten) auslesen. --Kolja21 (Diskussion) 10:45, 7. Nov. 2012 (CET)

Die inzwischen tausendfach eingebaute Normdatenvorlage in der en.wikipedia wurde ja aus genau diesen VIAF-Daten generiert, das wäre kein Vorteil (das einzubeziehen wird erst sinnvoll, wenn genügend manuell eingefügt/korrigiert wurden oder wenn die de.wikipedia miteinbezogen würde). --FA2010 (Diskussion) 10:52, 7. Nov. 2012 (CET)
Mir ist das gerade eben bei Evelyn Hamann aufgefallen, wo der VIAF-Eintrag auf en:Evelyn Hamann zielt. Da dort keine Normdaten vorhanden sind und es auch keinen LCCN-Eintrag gibt, wage ich mal eine These: Über die VIAF-DNB-Verknüpfung und die BEACON-Verknüfpung von DNB und de.WP wird der Artikelname der englischsprachigen Wikipedia automatisch aus den Interwikilinks extrahiert und im VIAF eingetragen. Klingt etwas abenteuerlich, ist für mich jedoch logischer als der Abgleich von Namen und Geburts-/Todesdaten mit den VIAF-Einträgen. Oder gibt es im VIAF Datensätze mit WKP- jedoch ohne DNB-Eintrag? --32XAutorenngilde № 1 16:19, 7. Nov. 2012 (CET)
Oder auch nicht. Im Artikel Lara Cox gibt es keinen GND-Eintrag und dennoch verlinkt der VIAF-Eintrag auf die en.WP. Jetzt könnte man noch spekulieren ob die Daten über en.WP↔de.WP→VIAF→en.WP ermittelt wurden. --32XAutorenngilde № 1 16:24, 7. Nov. 2012 (CET)
So abenteuerlich/unerschrocken der Ansatz "kursiver Text" = "Werktitel" auch erstmal erscheint, unter http://viaf.org/processed/WKP%7CEvelyn_Hamann (Rohdaten zum en:wikipedia-Pseudo-Datensatz) ist ein kursiver Übersetzungshinweis vom Artikelende zu einem Werk mutiert. – Weiter oben auf der Diskussionsseite war das VIAF-Skript #wikipedia2auth3.py http://dl.dropbox.com/u/10997393/wikipedia2auth3.py schonmal Thema. Im Skript findet sich (Zeile 194) ein regulärer Ausdruck titlepat = re.compile(r"[^']''(?:\[\[)?([^]]+?)(?:\]\])?''"). Das sieht doch verdächtig nach "Text in Doppelapostrophen, Doppelklammern (eckig) verwerfen" ggf. in Kombination mit den Folgezeilen. Verstehe nicht genug von Regulären Ausdrücken Höherer Ordnung, um das jetzt sicher zu durchblicken. -- Make (Diskussion) 17:35, 7. Nov. 2012 (CET)

GND-Statistik

Hallo Freunde der Normdaten und Statistiken ;). Ich habe mal einen kleinen Statistiklauf gemacht und dabei ermittelt, wie die Quote an GNDs bei verschiedenen Nationalitäten ist. Benutzt wurden dazu die jeweiligen Nationalitätenkategorien (und deren Unterkategorien). Aus unerfindlichen Gründen habe ich die Italiener vergessen.. wäre jetzt zu aufwendig, dies noch nachzuholen...

Kategorie Personen gesamt Anteil mit GND
Person 458.490 43,2 %
Deutscher 134.690 61,2 %
US-Amerikaner 53.587 38,9 %
Brite 17.360 53,3 %
Österreicher 17.185 54,4 %
Franzose 15.964 60,1 %
Schweizer 10.254 58,0 %
Russe 4.758 53,7 %
Japaner 4.713 28,0 %
Niederländer 4.457 56,0 %
Spanier 3.934 41,7 %
Kanadier 3.526 37,6 %
Pole 3.295 47,6 %
Schwede 2.918 55,0 %
Däne 2.264 50,4 %
Tscheche 2.176 58,7 %
Ungar 2.023 61,2 %
Australier 1.869 37,6 %
Chinese 1.775 31,0 %
Norweger 1.628 49,7 %
Türke 1.604 37,4 %
Brasilianer 1.555 28,9 %
Sowjetbürger 1.444 55,2 %

Demnächst werde ich versuchen, auch mal andere Statistiken erstellen zu lassen (z.B. bzgl. Person nach Tätigkeit). --APPER\☺☹ 18:11, 8. Nov. 2012 (CET)

Hallo Apper, wenn Du magst, kannst Du solche Statistiken als Wikipedia:Statistik der Biografien anlegen und die bisherige Version auf z. B. Wikipedia:Statistik der Biografien/2009 verschieben, ist ja nun bald 4 Jahre alt. Gruß, Aspiriniks (Diskussion) 18:19, 8. Nov. 2012 (CET)
Ich hab mir die Brasilianer (niedrige Quote!) ohne Normdaten mal angesehen, da sind eben ganz viele Fußballer und Rennfahrer dabei, dazu noch ein paar Models, Diplomaten, "Geschäftsleute" und katholische Allerweltsbischöfe, da kann das schon mal zustandekommen... Bei Australiern, US-Amerikaner, auch Brasilianern, gibt es außerdem oft eingetragene VIAF (bei Japanern auch: NDL bzw. jetzt auch VIAF), die sind also schon irgendwie eingebunden im Normdatensystem, und werden von der GND wohl nie erfasst werden. Außerdem nicht zu vergessen: IMDb als Quasistandard für die vielen Filmschauspieler ist ebenfalls ein Eintrag, der zur Verknüpfung von personenbezogenen Angeboten verschiedener Anbieter durchaus taugen würde, da gibt es sehr selten krasse Fehler bei der Individualisierung (ich finde ja, die IMDb sollte dringend in VIAF eingebunden werden). --AndreasPraefcke (Diskussion) 09:44, 9. Nov. 2012 (CET)

Nach Tätigkeit

So, jetzt noch nachgereicht die Statistik nach Kategorie:Person nach Tätigkeit. Zunächst entsprechend der Hauptkategorie, darunter einige weitere Aufschlüsselungen für einige Kategorien. Wenig überraschend ist der Spitzenreiter: die Bibliothekare mit einer Quote von fast 90%. Genauso wenig überraschend: die Sportler-Quote von 3,2% - und die Politiker sind auch unterhalb des Durchschnitts.

Kategorie Personen gesamt Anteil mit GND
Person 458.489 43,2 %
Autor 56.579 76,9 %
Bibliothekar 917 89,3 %
Diplomat 6.855 41,9 %
Entdecker 1.104 66,2 %
Geistlicher 21.758 44,4 %
Herrscher 14.165 40,8 %
Hochschullehrer 46.577 80,8 %
Ingenieur, Erfinder, Konstrukteur 11.703 56,4 %
Journalist 11.221 67,0 %
Jurist 19.349 44,1 %
Künstler 118.662 56,1 %
Mediziner 10.608 70,7 %
Militärperson 1.658 56,6 %
Pädagoge 6.696 72,2 %
Politiker 80.282 34,5 %
Psychologe 1.347 79,7 %
Sportler 92.309 3,2 %
Übersetzer 1.930 88,3 %
Unternehmer 16.582 47,7 %
Wissenschaftler 71.034 75,0 %

Die Wissenschaftler nochmal genauer untersucht:

Kategorie Personen gesamt Anteil mit GND
Wissenschaftler 71.034 75,0 %
Agrarwissenschaftler 997 70,7 %
Geisteswissenschaftler 34.651 77,7 %
Informatiker 1.083 51,2 %
Kunstwissenschaftler 2.487 86,9 %
Mathematiker 4.310 69,7 %
Naturwissenschaftler 18.121 68,9 %
Ökonom 2.929 81,2 %
Philosoph 4.103 89,2 %
Psychologe 1.347 79,7 %
Sozialwissenschaftler 25.287 86,0 %

Die Sportler genauer untersucht:

Kategorie Personen gesamt Anteil mit GND
Sportler 92.309 3,2 %
Basketballspieler 2.054 1,7 %
Badmintonspieler 3.475 0,3 %
Eishockeyspieler 7.836 0,5 %
Eiskunstläufer 1.037 5,2 %
Footballspieler 988 3,2 %
Fußballspieler 27.558 1,8 %
Handballspieler 1.936 1,7 %
Kampfsportler 4.249 4,2 %
Leichtathlet 8.025 3,1 %
Radsportler 6.700 1,8 %
Rennfahrer 3.220 5,7 %
Ringer 1.520 1,4 %
Schachspieler 1.874 14,9 %
Schwimmsportler 1.772 3,8 %
Tennisspieler 2.140 4,1 %

Dann die Künstler weiter aufgeschlüsselt (die Quote wird nur durch Filmschaffenden nach unten gezogen):

Kategorie Personen gesamt Anteil mit GND
Künstler 118.662 56,1 %
Architekt 5.697 63,5 %
Bildhauer 4.691 68,6 %
Designer 2.312 67,3 %
Filmschaffender 41.015 42,5 %
Fotograf 2.492 73,6 %
Grafiker 6.192 72,0 %
Kunsthandwerker 3.429 62,5 %
Liedtexter 905 82,3 %
Maler 14.293 73,1 %
Regisseur 9.639 58,0 %
Songwriter 2.338 60,6 %
Theaterschaffender 5.908 56,1 %

Und von den Künstlern nochmal die Filmschaffenden (die Quote wird durch die Schauspieler nach unten gezogen):

Kategorie Personen gesamt Anteil mit GND
Filmschaffender 41.015 42,5 %
Drehbuchautor 5.580 60,9 %
Filmkomponist 1.719 71,3 %
Filmproduzent 2.949 46,8 %
Filmregisseur 5.758 60,8 %
Kameramann 1.242 65,7 %
Schauspieler 27.989 37,0 %
Synchronsprecher 1.931 41,7 %

Ich hoffe, noch jemand außer mir findet diese Statistiken interessant ;). --APPER\☺☹ 22:34, 8. Nov. 2012 (CET)

Doch, finde ich sogar sehr spannend, obwohl wir ja nicht wissen, wieviele Bibliothekare etc. wir absolut abdecken: Die Prozentzahlen messen also nur den Grad der Interessenabweichung zwischen Bibliotheken und Wikipidia, bzw. um noch genauer zu sein, den zwischen den Input-Produzenten von Bibliotheken (evtl. gestört durch Erschliessungs-Bias der Bibliotheken) und Wikipedia-Autoren...
BTW, macht es Sinn, solche Auswertungen für gewisse Ehrungs- und Preisträgerkategorien durchzuführen? Bei Nobelpreisträgern etwa ist die Wikipedia fast vollständig und bei anderen (ich denke da an documenta-Künstler, Teilnahme ist ja auch eine Art Auszeichnung, oder Fußballer des Jahres) können wir über Listen-Artikel die Vollständigkeit abschätzen. Zudem sind das ja externe Indikatoren für "Wichtigkeit", was gewisse Unausgewogenheiten in der Wikipedia durch regionale oder persönliche Vorlieben der Autoren ausgleichen kann. -- Thomas Berger (Diskussion) 01:09, 9. Nov. 2012 (CET)

Das sind wohl Zahlen mit individualisierter GND, oder? Gerade bei Filmschauspielern gibt es z. B. sehr, sehr oft eine Namens-GND, die über den B3KAT recht eindeutig einen Schauspieler bezeichnet (das sieht man schnell, wenn dort unter der Namens-GND nur Filme erscheinen). Da die DNB amerikanische Filme wohl nicht sammelt oder zumindest nicht derartig erschließt, wird das wohl ewig dauern, bis diese Sätze mal individualisiert werden. Dass Sportler einen geringen Abdeckungsgrad haben, ist klar, nur die wenigsten sind a) Autoren b) Buchthemen oder selbst c) in biographischen Datenbanken. Wenn man ehrlich ist und die paar hundert Sportler nimmt, die wirklich enzyklopädisch interesant sind (wenn man alle anderen Lexika dieser Welt als MAßstab nimmt), ist die GND-Abdeckung gar nicht mal schlecht. Von denen in der Hall of Fame des dt. Sports z. B. haben die meisten eine GND (nicht alle), siehe BEACON-Datei. --AndreasPraefcke (Diskussion) 08:50, 9. Nov. 2012 (CET)

Die geringe Abdeckung bei den Sportlern basiert zum Teil vielleicht auch auf der Tatsache, dass eine Menge Sportler-Artikel rein auf Zahlenmaterial aus Online-Datenbanken basiert und zusätzliche biographische Daten eher Nebensache zu sein scheinen. Deshalb haben wir sehr viele (da simpel zu erstellende) Artikel zu Sportlern aus kleinen afrikanischen oder asiatischen Ländern, wo biographische Literatur und Normdateien Mangelware sind. Bei manchen Ländern und Sportarten ist die Wahrscheinlichkeit um einiges höher, dass Normdaten existieren. Z. B. bei amerikanischen olympischen Eiskunstläuferinnen oder älteren Football- und Baseballspielern lohnt es sich zumindest mal, den Namen in VIAF einzugeben (im Gegensatz zu taiwanesischen Badmintonspielern oder ghanaischen Läufern). Auffällig ist, dass wenn von Sportlern verfasste Bücher existieren, sie so gut wie nie in unseren Sportler-Artikeln erwähnt werden. --Kam Solusar (Diskussion) 15:30, 9. Nov. 2012 (CET)
Zum letzten Satz von Kam Solusar: Ja, das ist mir auch schon aufgefallen. Dass ich einen Sportler recherchiere und dann über die DNB rausfinde, dass die Person ein Buch geschrieben hat, dies aber nicht in der WP vermerkt ist... leider. Zu Andreas: Hier wurde nicht nach Tp/Tn unterschieden sondern ich habe die Datenbank vom Toolserver genommen, also alles was unter GND= und PND= in der Normdaten-Vorlage eingetragen ist (was auch nicht individualisierte GNDs sein können). Bei Sportlern wird sich nicht viel ändern. Bei Schauspielern hatte ich schon das Gefühl, dass in den letzten Monaten/Jahren viele neu in der GND hinzugekommen sind und die Quote gegenüber z.B. 2009 stark gestiegen ist. Bei Politikern steigt die Quote derzeit wohl auch ziemlich - also bei den deutschen Politikern. Nämlich dadurch, dass die Nachlassdatenbank des Bundesarchivs anscheinend in den letzten Monaten alle ihre Personen eingetragen hat (rund 25.000) - siehe GND 102468704X oder GND 102623848X. Bei letzterem siehe meine Einfügung. Bei sehr vielen dieser Nachlassdatenbank-Politiker wurde erst um den letzten Jahreswechsel GNDfehlt in den Artikel eingetragen - weil ich das schon in mehreren Dutzend Fällen hatte gehe ich davon aus, dass da die Quote noch steigen wird. Auch aus der "Personen-Datenbank zur Geschichte des Bayerischen Parlaments" wurde wohl einiges eingetragen (siehe GND 1020699396). Bei US-amerikanischen Politikern sieht das anders aus - dort ist die Quote gefühlt sehr sehr gering. Klar gibt es zu vielen keine Bücher (Sportler, Politiker, Schauspieler) - aber auch andere Institutionen als nur Bibliotheken nutzen ja die GND. Wenn z.B. irgendeine Sportlerdatenbank Partner der DNB würde und die GND nutzen würde, würde vielleicht auch da die Quote steigen. Wobei zugegeben taiwanesische Badmintonspieler wohl noch lange auf sich warten müssen ;). --APPER\☺☹ 16:56, 9. Nov. 2012 (CET)

WorldCat & Normdaten

Es gab mal eine Diskussion in den Normdaten zum WorldCat zu verlinken WorldCat ID. Auf der Engl. WP gibt es dazu eine Maske auf WorldCat ID. Ich selbst bin den Weg über worldcat.org gegangen weil dann z.B. unter "WorldCat" bibliographie zu Chr. Slezak-Schindler mann schneller zum Ziel kommt, wo die Medien konkret ausgeliehen werden können (zwei statt 3 Klicks). Es wäre schön wenn von den Wiki-Spezialisten ein Verfahren und ein normierter Link zu dieser sehr gute bibliographische Datenbank festgelegt werden könnte (WorldCat erlaubt dabei sogar die Einbindung ihres Logos / ihrer Vignette). Der Weg über {{Normdaten|TYP=p|}} = Wikipedia Personensuche) ist doch ein aussergewöhnlich langer (4 Klicks). Wer hat eine gute Idee? Wer ist befähigt es um zu setzen? --Deklamat (Diskussion) 21:07, 12. Nov. 2012 (CET)

Hallo Deklamat, den Link zu WorldCat hatten wir eine zeitlang drinnen und bei der Überarbeitung wieder rausgeworfen, da es kein Normdatenlink ist, sondern nur eine verbesserte Variante der Namenssuche, die auch Werke anderer Autoren anzeigt. Falls er in Einzelfällen hilfreich ist, kann man ihn analog zur Vorlage:DNB-Portal mit der Vorlage:Worldcat id eintragen. Gruß --Kolja21 (Diskussion) 02:40, 13. Nov. 2012 (CET)
Deklamat hat natürlich recht, die Personensuche über den Toolserver ist eine Krücke. In der Wikipedia müsste mit einem Klick die Normdatenleiste ausklappbar sein und alle Anwendungen darstellen (ein AKS-Service eben). Ist das eigentlich so schwer zu programmieren? --FA2010 (Diskussion) 08:44, 13. Nov. 2012 (CET)
Für Kolja21 Argumente habe ich Verständnis, und danke für den Hinweis. Es beantwortet aber nicht ganz zielgenau meine Frage. Mir scheint, dass FA2010 die Frage verstanden hat. Es müsste ggf. tatsächlich ein spezielles neues "Normfeld" ggf. + mit Vignette von WorldCat dafür entwickelt werden. Ich kann kaum richtig in Wiki richtig formatieren und das schon garnicht. --Deklamat (Diskussion) 10:50, 13. Nov. 2012 (CET)
PS Dieser link z.B. * Literatur von und über Christa Slezak-Schindler in der bibliografischen Datenbank WorldCat (* {{Worldcat id|lccnno=no/2007/51761|TEXT=Literatur von und über|NAME=Christa Slezak-Schindler}}) führt noch nicht ganz auf die Seite die mir Vorschwebt (braucht 3 - 4 klicks). Es müsste eher gleich hierhin führen:
Nein, das wäre nichts, denn das ist ja einfach nur eine Namenssuche, während der andere Link auf der LCCN basiert. --FA2010 (Diskussion) 11:19, 13. Nov. 2012 (CET)
OK ich merke schon, dass ich das genaue Ziel / der beabsichtigte Zweck noch nicht gut erfasst habe (mein Zweck ist scheinbar nicht adäquat für WIKI. Es fehlen mir wohl entscheidende Grundlagen-Kentnisse und ich überlasse euch die Findung der angemessene Lösung. --Deklamat (Diskussion) 11:28, 13. Nov. 2012 (CET)
Kurz zur Erklärung: bei dem genannten Namen merkst Du den Unterschied kaum, aber wenn Du mal nach den Werken eines bestimmten "Wilhelm Müller" suchst, wird das deutlich. Dein Link würde einfach nur alle Bücher von allen Wilhelm Müllers listen, der auf Normdaten basierende nur die eines bestimmten Wilhelm Müllers. --FA2010 (Diskussion) 11:39, 13. Nov. 2012 (CET)
MERCI! & Kapito! --Deklamat (Diskussion) 14:42, 13. Nov. 2012 (CET)

Wie wäre es, wenn wir den Worldcat wieder reinnehmen wenigstens für die, die sich auch die Personendatan anzeigen lassen (und somit auch den PICA und AKS-Link bei der GND sehen)? --FA2010 (Diskussion) 11:01, 13. Nov. 2012 (CET)

Aber gerade dieser Thread zeigt doch schön die Probleme damit: Die "persistente" Worldcat-URL wird mit der LCCN gebildet, wenn Worldcat die LCCN nutzt, sonst mit einer Namensform (und es gab noch eine dritte Variante, wenn ich mich recht entsinne). Die "Worldcat-Identities" sind also ein Flickenteppich und es muss irgendwo in der Normdaten-Vorlage hinterlegt werden, welches Schema Worldcat für diese Person nutzt und was ggfls. die Namensform ist (und ob es Treffer gibt, oder der Link unterdrückt werden sollte oder ob es zwar Treffer gibt, die aber verschiedene Personen vermischen, was dann wiederum wacker angemerkt werden muss, und ob es Treffer unter mehreren Schemata gibt, etwa auch unter dem Hilfs-Identifier np-slezak schindler, christa). Der von uns im Frühjahr herausgekegelte Parameter "WorldcatID" versuchte das zu regeln, aber er hätte zudem auch noch wiederholbar sein müssen... Das ist außerdem alles nur eine Momentaufnahme, eben weil die Worldcat-Adressierung nicht durchgehend normdaten-basiert und nicht wirklich persistent ist. Kurz: Selbst eben kein Normdatum ist. Das ist auch klar, weil Worldcat die physische Vereinigung einer vielzahl von Datenbanken ist, die günstigstenfalls für sich einer Normdatenkontrolle unterliegen, aber natürlich nicht nach einnheitlichem System (und das ist auch der Grund dafür, dass die von der Personensuche gelieferte Seite nicht das "vorgeschwebte" Ergebnis liefert: gewisse Titel sind über die LCCN selektierbar, andere nur über Namen und Worldcat ist eben eine Datenbank, in der man recherchieren kann, selbst wenn überwiegend LCCN genutzt wird ist nie gewährleistet, dass zu jeder Person und zu jedem ihrer Titel so zugreifbar ist).
Also, wir können in der Wikipedia die Worldcat-URLs nicht vernünftig pflegen, eben weil es keine Normdaten sind und mittelfristig auch keine werden wollen (in den Worldcat wird "hochgeladen", da wird eher nicht selber herumredigiert und "Normdatenarbeit" gemacht). Und darum gehören WorldcatIDs auch nicht in die Normdaten-Vorlage (und erst recht nicht die Namensformen/Suchterme, die das beste Rechercheresultat liefern, wie es dem ursprünglichen Frager vorschwebte). Überdies gilt auch noch das alte Argument, dass die Normdaten-Anzeige als Hauptfunktion Identifikation hat und nicht das enge "Einstieg in Literatursuche" (sobald das für die "Konfigurierten" sichtbar ist wird einer kommen und es genau umgekehrt haben wollen: Keine Nummern sondern nur den Worldcat-Link sollen die Nicht-angemeldeten etc. sehen...): Und da für gewisse Personen bestimmt andere Kataloge bessere Alternativen sind als Worldcat, braucht man eher eine Übersichtsseite analog der ISBN-Suche, nur eben auf Personen bezogen und die Normdatenvorlage kann neben "Personensuche" noch "Literatursuche" einblenden. Die Personensuche leistet das in Ansätzen aber bereits: Im Beispiel Christa Slezak-Schindler liefert der Link "Personensuche" die Toolserver-Seite, die den (LCCN-basierten) Worldcat-Link anbietet: Exakt zwei Klicks vom Artikel entfernt. -- Thomas Berger (Diskussion) 15:29, 13. Nov. 2012 (CET)
@Deklamat: Ich habe bei Christa Slezak-Schindler den Link auf das {{DNB-Portal|110910664}} gelöscht, da es sich um einen Tn handelt, der in die Normdatenvorlage gehört (Parameter "GNDName"). Im Moment, heute am 13. November, mögen die Treffen passen, aber die Nr. ist nur temporär und schon nächsten Monat können dort Bücher anderer Autoren oder gar keine Werke angezeigt werden (s. Hilfe:GND#Personen). --Kolja21 (Diskussion) 19:01, 13. Nov. 2012 (CET)
Da bei Christa Slezak-Schindler die Worldcat ID mit der LCCN funktioniert, habe ich nun die oben genannte Vorlage:Worldcat id in den Artikel eingebaut und den Link auf die Suche ersetzt. --Joe-Tomato (Diskussion) 20:06, 13. Nov. 2012 (CET)
@Thomas Berger Von der Toolserver-Seite zum Chr. Slezak-Schindler bleiben es 4 Klicks, aber ich verstehe allmählich besser die Argumente und es hängt für mich nicht hoch. --Deklamat (Diskussion) 21:47, 13. Nov. 2012 (CET)
Es sind von dort aus drei Klicks, aber das auch nur, weil Du mit der reduzierten Titelzahl beim ersten Klick scheinbar nicht zufrieden bist und in Woldcat durch (zweiter Klick) Anzeige eines beliebigen Treffers die (dritter Klick) assoziative Recherche nach der gegebenen Namensform einleitest... -- Thomas Berger (Diskussion) 16:25, 14. Nov. 2012 (CET)
@Kolja21 Einleuchtend, Danke, Prima! --Deklamat (Diskussion) 21:47, 13. Nov. 2012 (CET)
@Joe-Tomato Ist sonnenklar, hatte auf Diskussion:Christa_Slezak-Schindler und auf Hambornus Diskussion Hambornus schon vorgewarnt. --Deklamat (Diskussion) 21:47, 13. Nov. 2012 (CET)

Normdaten Familien

Mir ist aufgefallen das einige Familien, speziell Adelsgeschlechter, mehrere GND-Nr. besitzen. Das betrifft vor allem Adelsfamilien die sich in mehrere Linien aufgespalten haben aber in de.Wiki nur einen Artikel besitzen. Sollen nun alle vergebenen GND's in den Artikel zu dem betreffenden Geschlecht ergänzt werden? -- Proxy (Diskussion) 11:34, 18. Nov. 2012 (CET)

Keinesfalls. Aber vielleicht lassen sich unter dem Namen des jeweiligen Zweigs Weiterleitungen auffinden oder anlegen, die dann mit dem entsprechenden Normdatum versehen werden können? -- Thomas Berger (Diskussion) 11:54, 18. Nov. 2012 (CET)
Hmm, in Redirects die GND's einfügen? Habe ich noch nie probiert, weiß gar nicht ob das funktioniert. Ist mir ja bis jetzt auch nur bei 2 Familien aufgefallen. Aber mal noch eine andere Frage, die in der NDB gelisteten Familien besitzen alle GND-Nr. - ist das richtig? Leider finde ich zu vielen im DNB-Katalog keine entsprechende GND. Mach ich da irgendwas falsch - fragt -- Proxy (Diskussion) 12:10, 18. Nov. 2012 (CET)
Hallo Proxy, bei Personengruppen sind Normdaten in Redirects nichts ungewönliches, siehe Don Everly von The Everly Brothers. In manchen Fällen eignet sich auch der Parameter "REMARK". Die Neue Deutsche Biographie ist älter als die GND und beide Projekt sind voneinander unabhängig. Wenn du im DNB-Katalog nicht fündig wirst, gibt es auch keine GND. Gruß --Kolja21 (Diskussion) 17:41, 18. Nov. 2012 (CET)
Hallo Kolja, besten Dank für die Infos!! Bei der Verknüpfung der NDB und der DNB mittels GND fand ich diese Wartungsliste Wikipedia:NDB-Link ohne GND. Dort erscheinen diverse Familien und Namensträger als GND-vergeben nur fand ich im DNB-Katalog, zumindest bei den Familien, nix. Ist etwas verwirrend, beim nochmaligen lesen der Wartungsliste kam die Erleuchtung - es ist (noch) nicht zu jeder Person bzw. Familie eine GND zugeordnet. Grüße -- Proxy (Diskussion) 08:17, 19. Nov. 2012 (CET)

VIAF enWP deWP Konfliktlisten

Hi. Max Klein hat eine Liste mit Konflikten veröffentlicht, die beim Eintragen von Links VIAF/enwp aufgetreten sind und sich auf die deutschsprachige Wikipedia und das Template Normdaten beziehen. Ein Abgleich innerhalb dewp könnte hilfreich sein, welche Konflikte davon auf Fehler in der deWP zurückzuführen sind, welche überhaupt nicht fehlerhaft sind und wo noch Korrekturbedarf besteht. Ein Blogposting dazu gibt es auf hangingtogether. -- Mathias Schindler (WMDE) (Diskussion) 08:00, 1. Dez. 2012 (CET)

Danke für den Hinweis. Conflict4 betrifft uns nicht direkt (bzw. hier kann man wohl fehlende VIAFs nachtragen). Conflict6/Conflict8 habe ich mir einige Beispiele angeschaut: Fast immer ist das Problem, dass es zwei VIAF-Cluster gibt und der en.wikipedia-Eintrag im anderen Cluster als der DNB-Eintrag ist. Teilweise ist nicht nachvollziehbar, wieso es zwei Cluster gibt, in einem Fall habe ich ein falsches Geburtsjahr bei der DNB entdeckt. Conflict12 scheinenFälle wie Bettina Rheims zu sein, bei denen das einzige Problem ist, dass die im Artikel angegebene VIAF-ID auf eine andere weiterleitet (und diese die korrekte ist). Die wenigen Fälle des Conflict13 scheinen es auch wert zu sein, angeschaut zu werden. --APPER\☺☹ 12:56, 1. Dez. 2012 (CET)
Was ich unter Conflict13 (und auch auf den anderen Seiten) angeschaut habe, hab ich dort kommentiert und eine grobe Kategorie vorangestellt. Aber ergiebig sind die Listen nicht. Eher ein Spiegelbild der bekannten VIAF-Schwächen wie in Michael Crichton, wo VIAF einen einzigen falschen (siehe Nachtrag) Datensatz unter alter ID weiter führt, mit den anderen Datensätzen zu einem neuen Cluster umgezogen ist. Plus Bot-Murks wie in Ákos Kovács, wo ein "leerer" VIAF-Parameter zu einem Konflikt führt. – Schade, dass die Ausbeute aus dem VIAFbot-Projekt für de:Normdaten so dürftig ist, hatte da mehr erhofft. -- Make (Diskussion) 22:12, 1. Dez. 2012 (CET)
Nachtrag: Nochmal genauer geschaut: Bei Michael Crichton hat das Pseudonym Michael Douglas, unter dem Michael Crichton zusammen mit seinem Bruder Douglas Crichton 1970 den Roman http://lccn.loc.gov/70127093 veröffentlich hat, zu den VIAF-Verschiebungen geführt. Bis Juni 2010 war das Duo-Pseudonym unter http://viaf.org/viaf/87773632/ mit zahlreichen Datensätzen zu Michael Crichton geclustert. Bei der (korrekten) Abtrennung hat der VIAF-Algorithmus dann aber dazu geführt, dass das Duo-Pseudonym unter alter ID verblieb, während die vielen Ein-Personen-IDs in Cluster http://viaf.org/viaf/89578936/ aufgesammelt wurden. Insgesamt ein ganz interessanter und anschaulicher Fall, ausgelöst möglicherweise durch – für ein Kollektiv unsinnige – Lebensdaten bei der Spanischen Nationalbibliothek id=XX889030. Typisch an diesem Beispiel auch der später entstandende kleinere Parallelcluster unter http://viaf.org/viaf/205642635/ – verursacht durch einen Namens-Datensatz der GND. -- Make (Diskussion) 17:45, 3. Dez. 2012 (CET)

Neue(?) VIAF-Dumps

Unter http://viaf.org/viaf/data/ sind Dumps vom 27. November 2012 verfügbar. Ich bin mir nicht ganz sicher, aber die als persist-rdf.xml (ganz unten) verfügbare Liste der Redirects innerhalb VIAF gab es meiner Erinnerung nach früher nicht. Könnte für Tools und Auswertungen nützlich sein, weil damit abgegrenzt werden kann (a) echt verschiedene VIAF-Nummern (führen zu verschiedenen Clustern) gegen (b) VIAF-Nummern, die nach Redirect den gleichen Cluster identifizieren. -- Make (Diskussion) 15:14, 3. Dez. 2012 (CET)

Hi Make, kannst du sehen, wie aktuell die in den Dumps vom 27. November 2012 enthaltenen Daten sind? Ich habe den Eindruck, dass VIAF nur einen kleinen Teil seiner Daten regelmäßig aktualisiert. Neueinträge aus SUDOC und NLA (Australien) fehlen beispielsweise - und das seit einem halben Jahr. Wäre interessant zu wissen, inwieweit Dumps und Datenbank übereinstimmen. --Kolja21 (Diskussion) 01:39, 4. Dez. 2012 (CET)

Veraltete Neue Wartungsliste aktualisiert

Die im September eingestellte Wartungsliste Benutzer:Gymel/GND-Probleme habe ich aktualisiert, Grundlage ist nun der Vergleich der GND mit Stand 19. Dezember abends mit dem Wikipedia-Dump vom 15. Dezember.

Der Bereich "veraltete Normdaten" ist diesmal ungleich größer, insbesondere bei Körperschaften und Geographika machen sich die im Juli angelaufenen automatisierten Umlenkungen in der GND bemerkbar. Für die Abarbeitung sehe ich keine Eile und auch keinen Grund, der gegen eine Automatisierung spräche. Allerdings sollten wir das für jede Gruppe noch einmal einzeln prüfen, wir wissen ja z.B. nicht, warum ein Namenssatz auf einen individualisierten umgelenkt wurde, evtl. ist die Bedeutung nun eine andere als die hier gemeinte Person...

Intellektuelle Bearbeitungen fordern der glücklicherweise winzige Bereich "Unbekannte Nummern" und die "Entitätenfehler": Hier habe ich diesmal unterschieden zwischen "neuer" und "alter" Nutzung der Vorlage:Normdaten, also ob die Sätze zu Personen nach der Vorlagenumstellung im Mai bereits angefasst wurden (Parameter "GND") oder nicht (Parameter PND). Gerade letztere sollten geprüft werden, weil hier wohl von Anfang an fälschlicherweise die Nummer eines Namenssatzes vermerkt ist, evtl. gibt es inzwischen einen individualisierten Satz oder die DNB kann um Individualisierung gebeten werden. Leider ist diese Gruppe mit knapp 2.100 Eintragungen die größte. Die andere Gruppe (Nummern von Tn-Sätzen im GND-Parameter) ist mit über 1.250 Einträgen zwar deutlich kleiner, andererseits handelt es sich durchweg um Nummern, die in den letzten 7 Monaten aktiv eingetragen worden sind: Vermutlich ein negativer Effekt der sich durchsetzenden Verbreitung von VIAF-basierenden Tools, die jegliche GND-Nummer als "GND" in die Vorlage einsetzen, sofern der Benutzer das passende VIAF-Cluster abnickt. Angesichts der von der Vorlage:NORMDATENCOUNT ermittelten Mengen handelt es sich um 1,3% Fehleranteil bei den neuen "GND"-Parametern und 1,7% bei den "PND"-Parametern, damit ist immerhin eine gewisse Verbesserung im Vergleich der Zeiträume vor und nach der GND-Umstellung sichtbar. -- Thomas Berger (Diskussion) 22:38, 20. Dez. 2012 (CET)

Die Liste ist super, da gibts gut zu tun, danke. Das wird die Qualität weiter heben :). Nutzt du einen kompletten GND-Abzug, den du scannen kannst auf bestimmte Dinge? Mir fallen immer wieder Artikel auf, bei denen eine GND fehlt, aber eine solche vorhanden ist und sogar bei der GND als Quelle "Wikipedia" angegeben ist. Also interessant wäre: Liste aller GNDs mit Quelle "Wikipedia", die nicht in der Wikipedia vorkommen. --APPER\☺☹ 02:18, 21. Dez. 2012 (CET)
Ich nutze den aktuellen GND-Abzug und habe alles, was seidem passiert ist, per OAI geharvestet. Allerdings nutze ich dies im RDF-Format, und da ist solche Metainformation, wie Du sie ansprichst, nicht enthalten. -- Thomas Berger (Diskussion) 08:18, 21. Dez. 2012 (CET)

Normdaten in Wikidata?

Wikidata ist seit Anfang des Monats für die Bearbeitung freigeschaltet. Hat jemand schon Erfahrung mit der neuen Datenbank? Ich habe den Eindruck, dass dort fast nur Informatiker am Werk sind und die inhaltliche Entwicklung noch völlig offen ist. Was mich beispielsweise stört, ist, dass keine Entitäten definiert wurden, d.h. jeder Eintrag ist gleich und man kann nicht ermitteln, wie viele der bislang 50.829 Datensätze ("items") sich auf Personen beziehen. Die Gemeinsame Normdatei findet sich übrigens unter d:Q36578. --Kolja21 (Diskussion) 14:27, 14. Nov. 2012 (CET)

Wikidata ist bislang nur für Interwikis freigeschaltet, alles andere kommt noch. Selbstverständlich wird die Normdatenvorlage eine der einfachsten Möglichkeiten sein, Daten aus der de-wikipedia nach Wikidata zu schaufeln, zusammen mit den Personendaten und den Ortsinfoboxen wohl auch die beste. Bislang wurden ja aber selbst die Interwikis noch nicht maschinell übernommen, Wikidata ist bislang nur eine Spielwiese. --FA2010 (Diskussion) 14:34, 14. Nov. 2012 (CET)
Mittlerweile gibt es Bots, die automatisch Interwikis einspielen. Wünschenswert wäre allerdings, wenn diese Bots vorher alle Verlinkungen auf Gegenseitigkeit überprüften. Bei Artikeln zu einer Person ist das in der Regel nicht notwendig, aber zum Beispiel bei Brüssel unterscheiden einige Wikipedias nicht zwischen Stadt und Region. --Monsieur Becker (Diskussion) 16:02, 14. Nov. 2012 (CET)
Die Interwiki-Bots erledigen genau diese Prüfungen doch schon seit Jahren (wenn auch nicht auf Wikidata). --FA2010 (Diskussion) 16:18, 14. Nov. 2012 (CET)
Das tun sie offensichtlich nicht: (de) Brüssel -> (af) Brussel, (en) Brussels ### (en) Brussels -> (de) Region Brüssel-Hauptstadt, (af) Brusselse Hoofstedelike Gewes ### (af) Brussel -> (de) Brüssel, aber keine Verlinkung zu (en). --Monsieur Becker (Diskussion) 10:25, 15. Nov. 2012 (CET)
Die Interwikilinks verlinken Artikel, die thematisch zueinander passen. Die Abweichungen sind, wenn man die Links unter dem Anspruch einer 1:1-Übersetzung betrachtet, teilweise enorm. Es wird spannend zu sehen, ob sich Wikidata Wikipedia anpassen wird oder umgekehrt. Falls das Projekt erfolgreich ist, würde Wikidata im Übrigen selbst zu einer einflussreichen Normdatei. Das ist auch unter dem Aspekt der Relevanzkritierien interessant. Theoretisch könnte man in Wikidata jede Person eintragen, zu der ein Tp vorliegt, unabhängig von den RK der Einzelwikis. --Kolja21 (Diskussion) 20:39, 14. Nov. 2012 (CET)
Und genau diese Verlinkung von Artikeln, die thematisch zueinander passen, wird in Wikidata nachgebildet. So what? Wikidata baut auf den Lemmata der diversen Wikipedias auf, es ist kein Übersetzungstool. --FA2010 (Diskussion) 08:46, 15. Nov. 2012 (CET)
Wikidata erfordert aber schon eine 1:1-Entsprechung der Artikel (nicht in Bezug auf den gesamten Inhalt, aber in Bezug auf das grundsätzlich Gemeinte), denn jeder Artikel einer Sprachversion kann nur einem Item zugeordnet werden, umgekehrt kann auch jedem Item nur ein Artikel aus einer bestimmten Sprachversion zugeordnet werden. In Fällen wie Brüssel führt dies zu drei Items: d:Q239 für Artikel zur Stadt Brüssel, d:Q240 für Artikel zur Region Brüssel-Hauptstadt und d:Q9005 für Artikel, in denen beides vermengt wird. --Monsieur Becker (Diskussion) 10:25, 15. Nov. 2012 (CET)
Der Einsatz von Normdaten in Wikidata ist jetzt auch auf der dortigen Disk Thema: d:Wikidata:Project chat#Authority control. --Kolja21 (Diskussion) 02:48, 16. Nov. 2012 (CET)
Nur zur Info: Die Seite ist ins Diskussionsarchiv umgezogen d:Wikidata:Project chat/Archive/2012/11#Authority control --Monsieur Becker (Diskussion) 10:42, 1. Dez. 2012 (CET)

Unter d:Wikidata:Property proposal#Authority control / Normdaten / Autorité wurden bereits ein paar Datenbankelemente genehmigt und auf die softwareseitige Implementierung gewartet. Gruß Matthias 19:24, 16. Feb. 2013 (CET)

Hm schade, (noch?) keine National Diet Library Classification. --Widerborst 13:55, 18. Mär. 2013 (CET)
erledigtErledigt Danke für den Hinweis (Web NDL Authorities). --Kolja21 (Diskussion) 14:25, 18. Mär. 2013 (CET)

Einige ungeklärte Fragen und Probleme sehe ich derzeit noch: 1) momentan kann dort per d:Property:P107 jeder etwas beim GND-Typ eintragen, wie er selbst es gerade passend findet. Eine 1:1-Abbildung der Typ-Angabe aus dem zugehörigen GND-Datensatz geschieht anscheinend nicht. Damit könnten wir dann in Zukunft zwar GND, LCCN und VIAF aus Wikidata beziehen, für den Typ-Parameter könnten wir uns dadurch aber nicht auf die gespeicherten Werte in Wikidata verlassen und müssten diese Angaben weiterhin lokal speichern und warten. Da ist die Frage, ob wir hier auf :de weiterhin die Typen-Angabe aus dem dazugehörigen GND-Datensatz angeben wollen, oder Artikelthemen stattdessen anhand einer eigenen Systematik von Wikidata-Bearbeitern klassifiziert werden sollen.

Hinzu kommt, dass die LoC und auch VIAF Normdateneinträge ja teilweise anders als die GND klassifizieren/listen. Schiffe, Raumfähren, etc.. beispielsweise hier meist "Sachbegriff", in der LoC meist als "corporate"; Gebietskörperschaften in der GND als Geografika, woanders als Körperschaften; Videospiele in der GND als Sachbegriff (*seufz*), woanders korrekterweise als Werk; Expeditionen in der GND und LoC teilweise als Versammlung, auf VIAF aber unter Corporate, usw.. Wäre es für andere Projekte und Sprachversionen mit Normdaten-Vorlagen nicht teilweise sinnvoller, wenn man dort statt GND vielleicht nur VIAF und LCCN verwendet, dann die LoC-Klassifizierungen zu nutzen?

Hab zwar die Diskussion unter d:Property talk:P107 überflogen, aber da scheinen die Meinungen über die Verwendung dieses Property ja ziemlich auseinanderzuklaffen.

2) Bisher habe ich keine Details dazu gefunden, wie die Eintragung der Normdaten dort in Zukunft einfach und schnell erfolgen kann. Tools á la Schnarks Normdaten-Tool gibt es dort ja (noch?) nicht. Was passiert, wenn jemand die Normdaten wie bisher lokal in einen Artikel einträgt? Werden die Daten dann wie bei den Interwiki-Links per Bot rübergeschaufelt?

3) Wenn keine Interwiki-Links existieren, wird auch kein Link zum entsprechenden Item gezeigt. Sollte man da vielleicht einen Link in der Normdatenvorlage ergänzen, eventuell auch nur für erfahrene User individuell per CSS einblendbar? --Kam Solusar (Diskussion) 12:48, 20. Mär. 2013 (CET)

Ich ergänze mal: 4) "Quelle" eines Normdateneintrags halte ich für ein nützliches Konzept, denke aber, dass es sich dabei um eine andere Ebene als bei der üblichen Verwendung handelt: "Bevölkerung von x ist n lt. Quelle q" setzt implizit voraus, dass Wikidata und Quelle q dasselbe x meinen. Bei den Normdaten geht es aber gerade um die Quelle für eine solche Identifikation, nur werden wir normalerweise gar keine Quelle ausserhalb der Wikpedia finden, die uns sagt, welche Person wir in einem Artikel meinen ;-). Quelle ist dann zwar irgendwie Beleg für die Statthaftigkeit der Zuordnung, das muss dann aber erschlossen werden (Vergleichbar könnte der Fall sein, dass eine Quelle ein julianisches Geburtsdatum angibt und wir das mit Daten über den Kalenderwechsel an diesem Ort zusammenführen müssen, um ein gregorianisches Datum zu erschließen). Andererseits ist es interessant festzuhalten, ob die hinterlegte Normdatennummer auf einem automatischen Matching durch VIAF oder manueller Inspektion von VIAF oder Inspektion des konkreten Normdatensatzes (etwa: Artikel und Normdatensatz beziehen sich beide auf denselben IMDb-Artikel: Ist IMDb dann auch Quelle?) oder Auffinden des konkreten Wikipediaartikels als Quellenangabe im Normsatz (also doch!) beziehen: Einerseits zur Abschätzung der Qualität (eine GND-Nummer, die durch doppelten VIAF-Match zustande kam ist im Zweifelsfall nicht optimal) aber andererseits auch zur Vermeidung von Zirkelschlüssen (wir nutzen manchmal die Lebensdaten aus den Normdateien, normalerweise ohne Einzelnachweis, und umgekehrt wird bei vielen Neuansetzungen von Normdaten auch die Wikipedia (in einer geeigneten Sprache) konsultiert. -- Thomas Berger (Diskussion) 13:11, 20. Mär. 2013 (CET)

Zu 2) Zzt. ist nur ein Durchlauf des VIAFBots geplant, der allerdings diesmal auch andere Normdaten (wie die GND) erfassen soll, siehe d:Wikidata:Requests for permissions/Bot/VIAFbot.
Zu 3) Die Vorlage Creator (im Sinne von Künstler) bei Commons verlinkt bereits auf Wikidata. (Beispiel: commons:Creator:Anselm_Feuerbach.) Ich finde das recht praktisch. --Kolja21 (Diskussion) 21:34, 21. Mär. 2013 (CET)