Kataloganreicherung

aus Wikipedia, der freien Enzyklopädie

Mit Kataloganreicherung (englisch catalog enrichment) werden Katalogisate eines Bibliothekskatalogs um weiterführende Informationen ergänzt, die über die reguläre Formal- und Sacherschließung hinausgehen. Das können bloße Bilder eines Buchumschlags sein, Inhaltsverzeichnisse, Abstracts, daraus abgeleitete automatische Indexierung und Übersetzung bis hin zum elektronischen Volltext eines Buches.

Beispiele und Formen

Die weiterführenden Inhalte im Rahmen der Kataloganreicherung[1] können unter anderem sein: die Angaben von Inhaltsverzeichnissen (Tables of Content, TOCs), die Einfügung von Inhaltsangaben und Abstracts,[2][3] die Aufnahme von Rezensionen,[4] die Übernahme von Volltexten[5] oder Empfehlungsdiensten.[6] Darüber hinaus können Coverabbildungen eingebunden werden. Eine weitere mögliche Form sind maschinell generierte Deskriptoren[7] auf Grundlage computerlingustistischer und/oder statistischer Extraktions- und Modifikationsverfahren auf Basis digitalisierter oder importierter Texte wie TOC, Abstract, Volltext oder Rezension.[8]

Das Tagging,[9] von Nutzern manuell ergänzte freie Deskriptoren oder von Verlagen übernommene Deskriptoren, gehört ebenfalls zu den üblichen Möglichkeiten. Die so genannte Query Expansion,[10] die Erweiterung der Benutzeranfragen durch zusätzliche semantische Ressourcen (Thesaurus, Ontologie,[11] Klassifikation, Taxonomie, Übersetzung und andere Listen) ist eine weitere Option.

Umsetzung und Geschichte

Die Anreicherung kann entweder durch Einbringung der Informationen (Inhaltsverzeichnisse, Inhaltsangaben, maschinell generierte Deskriptoren usw.) in den Katalogeintrag selbst oder durch Verlinkung erfolgen, wobei die verlinkte Quelle entweder auf einem Server der Bibliothek liegt oder von einem externen Anbieter zur Verfügung gestellt wird.

Viele Formen der Kataloganreicherung werden bereits seit mehreren Jahren von Buchhändlern im Internet angewandt. Anfang der 1990er Jahre erweiterte die Universitätsbibliothek Düsseldorf durch die maschinelle Indexierung der Titel und Untertitel die Menge der suchbaren Worte um Grundformen, Komposita-Zerlegung, Synonyme und Schlagworte aus der Deutschen Schlagwortnormdatei. Kataloganreicherung insbesondere mit Inhaltsverzeichnissen und daraus maschinell generierten Deskriptoren ist im deutschsprachigen Raum seit 2002 State-of-the-Art. Die zusätzlichen Inhalte sind in den Katalogsystemen teils über maschinell generierte Deskriptoren abfragbar, teils auch über in den Katalog übertragene meist kurze Texte.

Einige Bibliotheken beziehen die zusätzlichen Inhalte in die Suche bewusst nicht ein, insbesondere weil die meisten Bibliothekssysteme kein Relevance Ranking besitzen und bei eher allgemeinen Begriffen zu große Treffermengen befürchtet werden. Dadurch geht jedoch die Chance verloren, sehr spezifische Fachbegriffe oder z. B. Autoren von Sammelwerken finden zu können, die über maschinelle Indexierung erkannt und extrahiert werden (siehe auch Named Entity Recognition, Information Extraction oder Text Analytics).

Die deutschen Bibliotheksverbünde vereinbarten 2007 Standards für die Digitalisierung von Inhaltsverzeichnissen und Methoden des Austauschs. Seit 2008 nimmt die Deutsche Nationalbibliothek an der Produktion von Inhaltsverzeichnissen teil.

Man trifft in manchen amerikanischen Verbundkatalogen Inhaltsverzeichnisse (als Content Notes) an, deren Inhalte über die Keyword-Suche auffindbar sind und in denen bei Sammelbänden auch die Namen der Beitragsautoren über die Verfassersuche zur Verfügung stehen. Google geht das Thema noch forcierter an: es arrangiert sich Ende 2008 mit US-Verlagen und Autorenorganisationen bezüglich der Urheberrechte und digitalisiert massenhaft ganze Bibliotheken und die ganzen Werke und verlinkt über OCLC-WorldCat auf die dort registrierten Bibliotheken.

Literatur

Weblinks

Einzelnachweise

  1. Vom Katalog zur Bibliothek: Zwischenschritt und Zwischenstand. (Memento vom 14. Mai 2011 im Internet Archive) (PDF; 94 kB)
  2. Guidelines for writing abstracts. (Memento vom 14. Januar 2015 im Internet Archive) (PDF; 19 kB)
  3. What are Structured Abstracts?
  4. Edmund Schalkowski: Rezension und Kritik. UVK-Verlagsgesellschaft, Konstanz 2005. ISBN 3-89669-341-7.
  5. Beispiel: Digitale Volltexte der Universitätsbibliothek Bielefeld
  6. A. Klahold: Empfehlungssysteme: Grundlagen, Konzepte und Systeme. Vieweg+Teubner, Wiesbaden, 2009. ISBN 3-8348-0568-8.
  7. hebis.de (Memento des Originals vom 24. September 2015 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.hebis.de (PDF; 63 kB)
  8. vifa-recht.de (Memento des Originals vom 2. Dezember 2013 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.vifa-recht.de (PDF; 1,1 MB)
  9. Assoziative Elemente in der Inhaltserschließung: Kataloganreicherung (PDF; 1,4 MB)
  10. An example of query expansion in the interface of the Yahoo! web search engine in 2006
  11. Dissertationsprojekt zum Einsatz von Ontologien und ontologischen Wissensbasen zur Generierung von Query Expansion-Termen (Memento des Originals vom 31. Oktober 2009 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.dipf.de