Digital Object Identifier

aus Wikipedia, der freien Enzyklopädie
DOI-Logo

Ein Digital Object Identifier (DOI; deutsch Digitaler Objektbezeichner) nach ISO 26324 soll ein eindeutiger und dauerhafter digitaler Identifikator für physische, digitale oder abstrakte Objekte sein. Er wird vor allem für Online-Artikel wissenschaftlicher Fachzeitschriften verwendet. Verantwortlich für Integrität und Dauerhaftigkeit eines DOI ist die Organisation, die auch die Verantwortung für das jeweilige Objekt trägt. Das DOI-System baut auf dem Handle-System auf[1][2][3] und ist vereinfacht ausgedrückt mit ISBN und ISSN vergleichbar, soll jedoch durch eine integrierte Lokalisierungsfunktion darüber hinausgehen.

Funktionsweise

DOIs haben den Zweck, mit ihnen dauerhaft auf digitale Objekte verweisen zu können.

Dies wird erreicht, indem jedem Objekt ein eindeutiger und dauerhaft gültiger Name (Identifikator) zugewiesen wird. Anhand dessen kann aus einer zentralen Datenbank der URL abgefragt werden, unter dem das Objekt derzeit zugänglich ist. Es können auch mehrere URLs hinterlegt werden; es werden dann beim Zugriff auf das Objekt zunächst alle URLs aufgelistet. Mit dem DOI werden Metadaten über das referenzierte Objekt gespeichert. Die Metadaten müssen dem Schema der jeweiligen Registrierungsagentur (z. B. Crossref, DataCite) entsprechen.[4] Dies wird im Folgenden am Beispiel von Datacite[5] dargestellt. Auch die letzte Version der Metadaten zu dem Objekt kann abgefragt werden.

Eine technische Sicherstellung der Integrität ist nicht vorgesehen. Bis zur gegenwärtig aktuellen Version 4 des Metadaten-Schemas (Stand: Sept. 2017) ist keine Prüfsumme vorgesehen.[6] Die Metadaten können beliebig geändert werden, eine Auflistung der Änderungshistorie ist nicht vorgesehen.[7] Nach der Vergabe eines DOI kann ein digitales Objekt beliebig verändert oder ausgetauscht werden.

DOIs sollen das Problem toter Links lösen, indem Objekte nach der Änderung ihres URL trotzdem noch unter ihrem DOI zugänglich bleiben. Voraussetzung dafür ist jedoch, dass der Eintrag in der zentralen Datenbank bei jeder Änderung des URL aktualisiert wird. Die Verantwortung für die Aktualisierung liegt bei der Organisation, die auch für die Speicherung des digitalen Objekts und die URL die Verantwortung trägt.

Die zentrale Datenbank, in der die Identifikatoren und URLs gespeichert werden, wird von der International DOI Foundation betrieben. Die Betreiber speichern laut Datenschutzerklärung Folgendes: “

Our logs collect and store only domain names or IP addresses, dates and times of visits, and the pages visited.

[8]

Format

Die Struktur und der Aufbau des Digital Object Identifiers werden in der internationalen Norm ISO 26324:2012[9] beschrieben. DOI-Namen beginnen immer mit 10. und haben die Form 10.ORGANISATION/ID, wobei Organisationen (vor allem Verlage) jeweils eine eigene Nummer zugewiesen bekommen (beginnend bei 1000) und die ID selbst vergeben können. Verschiedene Organisationen setzen hier unterschiedliche Schemata ein: Manche benutzen die ISBN, mitunter werden Objekte schlichtweg durchnummeriert. Die Groß- oder Kleinschreibung von Buchstaben innerhalb von DOI-Namen ist irrelevant.

Als Uniform Resource Identifier wird DOIs die Schema-Kennzeichnung doi: vorangestellt, so dass sie die Form doi:10.ORGANISATION/ID haben.

In einer Publikation, die durch einen DOI identifiziert ist (z. B. doi:10.1371/journal.pbio.0020449), können weitere DOIs wiederum Teile identifizieren; so ist im angegebenen Beispiel eine Abbildung zu finden, die durch doi:10.1371/journal.pbio.0020449.g001 identifiziert wird. Dies findet man besonders oft bei Artikeln in einem Journal oder Kapiteln in einem Buch. Man kann aber nicht allgemein davon ausgehen, dass man ein DOI an einem Punkt oder Schrägstrich kürzen kann, um zu einem derartigen „übergeordneten Objekt“ zu gelangen, da es hier kein festes Schema gibt.

Beispiele

Der DOI 10.1000/182 identifiziert das Dokument 182 bei der Organisation 1000 (der DOI-Stiftung selbst). Es handelt sich hierbei um das DOI-Handbuch. Es kann im Internet gefunden werden, indem man entweder den DOI in die dafür vorgesehene Eingabemaske (DOI Resolver) der DOI-Stiftung einträgt oder indem man direkt die URL

aufruft. Dazu entfernt man ein eventuell vorhandenes Präfix doi: und ersetzt es durch den URL des DOI-Servers https://doi.org/. Die so gefundene Webseite ist aber typischerweise nicht das referenzierte Dokument selbst, sondern eine Seite über das entsprechende Dokument, mit der Möglichkeit, es herunterzuladen oder zu erwerben.

Auswahl registrierter Organisationen[10]
DOI-Präfix Besitzer
10.1000 International DOI Foundation
10.1001 American Medical Association
10.1002 John Wiley & Sons: Wiley-Blackwell
10.1007 Springer-Verlag
10.1016 Elsevier
10.1021 American Chemical Society
10.1038 Nature Publishing Group
10.1055 Thieme Verlagsgruppe
10.1063 American Institute of Physics
10.1073 National Academy of Sciences
10.1080 Informa UK (Taylor & Francis)
10.1088 Institute of Physics
10.1093 Oxford University Press
10.1098 Royal Society
10.1109 IEEE
10.1111 John Wiley & Sons: Blackwell Publishing
10.1128 American Society for Microbiology
10.1136 American Association for the Advancement of Science (AAAS)
10.1145 Association for Computing Machinery

Auflösung

Obwohl offiziell empfohlen wird, DOIs als vollen URL anzugeben, ist genau genommen nur der Teil, der mit 10. beginnt, der DOI. Der Teil davor bezeichnet einen HTTP-Proxy, den man DOI-Resolver nennt. DOI-Resolver lösen einen DOI auf, d. h., sie leiten den Webbrowser oder einen anderen Web-Client auf eine andere Website um, indem sie eine HTTP-Antwort senden, welche die Kopfzeile Location: gefolgt von einer Ziel-URL enthält.

Als DOI-Resolver muss keineswegs immer der Resolver der IDF (https://dx.doi.org/ oder https://doi.org/) verwendet werden, z. B. kann auch hdl.handle.net benutzt werden.[11] Daneben bieten einige DOI-Registrierungsagenturen eigene DOI-Resolver an, z. B. die mEDRA[12] und das PANGAEA Projekt.[13]

Die Resolver-Integration des Projekts Unpaywall startet anhand des DOI eine Suche nach einer frei verfügbaren Version des referenzierten Dokuments und leitet im Erfolgsfall direkt zu dieser weiter.[14] Als Datenbasis nutzt Unpaywall wissenschaftliche Inhalte von weltweit über 50.000 Fachzeitschriften und Open Access-Dokumentenserver.[15]

Verwendung

Für die meisten wissenschaftlichen Artikel seit dem Jahr 2000, teilweise aber auch bis zur Gründung der Zeitschriften zurückgehend, sind DOIs verfügbar. Der DOI eines Artikels kann bei dem dafür zuständigen Verlag ermittelt werden und findet sich meist auf der offiziellen Webseite des Verlages zu dem Artikel.

Manche Literaturverwaltungsprogramme können per Eingabe des DOI die Metadaten eines Artikels importieren. Wurde zu einem Artikel ein DOI angegeben, so kann die zugehörige Webseite oft direkt angezeigt werden. Wikimedia-Projekte wie Wikipedia verwenden DOIs in Quellenangaben und als Wikidata Property:P356.

In Verbindung mit dem Datensystem PANGAEA nutzte die Technische Informationsbibliothek 2005 als erste Institution DOIs für die Registrierung von Forschungsdatensätzen.[16] Die US-amerikanische Entertainment Identifier Registry EIDR verwendet das DOI-Präfix 10.5240.[17] Seit 2015 gibt es das Präfix 10.17487 für RFCs.[18]

DOI und andere spezielle Identifikatoren können helfen, Informationen über identische Referenzen mit unterschiedlicher Schreibweise in verschiedenen Sprachversionen von Wikipedia zu vereinheitlichen oder aufzufinden.

Siehe auch

Weblinks

Einzelnachweise

  1. Sam Sun, Larry Lannom, Brian Boesch: Handle System Overview. RFC 3650, November 2003.
  2. Sam Sun, Sean Reilly, Larry Lannom: Handle System Namespace and Service Definition. RFC 3651, November 2003.
  3. Sam Sun, Sean Reilly, Larry Lannom, Jason Petrone: Handle System Protocol (ver 2.1) Specification. RFC 3652, November 2003.
  4. Zu Unterschieden zwischen den Schemata vgl. Christian Gutknecht, DOIs und umfangreiche Metadaten bei Crossref. 13. Oktober 2019, abgerufen am 26. August 2020.
  5. DataCite Metadata Schema. DataCite, Metadata Working Group, abgerufen am 24. September 2017 (englisch).
  6. DataCite Metadata Schema 4.0. DataCite, Metadata Working Group, 19. September 2016, abgerufen am 24. September 2017 (englisch).
  7. DataCite API v2 for datacentres. DataCite, abgerufen am 24. September 2017 (englisch).
  8. Privacy Policy. International DOI Foundation, abgerufen am 24. Juli 2017 (englisch).
  9. ISO 26324:2012. Information and documentation -- Digital object identifier system. im ISO-Katalog
  10. The Topmost Cited DOIs on Wikipedia (Memento vom 25. Juni 2015 im Internet Archive), 10. April 2014
  11. Handle.net. In: https://www.handle.net/. Corporation for National Research Initiatives, abgerufen am 18. September 2017 (englisch, Beispiel: https://hdl.handle.net/10.1000/182).
  12. doi.medra.org, (Memento vom 6. August 2016 im Internet Archive) multilingual European Registration Agency of DOI.
  13. doi.pangaea.de, Data Publisher for Earth & Environmental Science mit Sitz in Deutschland.
  14. Link Resolver Integrations. In: unpaywall.org. 10. Januar 2020, abgerufen am 22. April 2020.
  15. Frequently Asked Questions. In: unpaywall.org. Abgerufen am 22. April 2020.
  16. H. Neuroth, A. Oßwald, R. Scheffel, S. Strathmann, M. Jehn: nestor Handbuch: Eine kleine Enzyklopädie der digitalen Langzeitarchivierung (Version 2.0), 2009: Kapitel 9.4.2 „Der Digital Object Identifier (DOI)“.
  17. About EIDR. In: https://eidr.org/. Entertainment Identifier Registry, abgerufen am 18. September 2017 (englisch, Wikidata Property:P2704).
  18. John R. Levine: RFC 7669 – DOIs for RFCs. Oktober 2015