Benutzer:SteffenampoffFritz/Bagit

aus Wikipedia, der freien Enzyklopädie

Das BagIt File Format definiert eine plattformunabhängige, hierarchische Verzeichnisstruktur und wird im Bereich der Speicherung und Übertragung digitaler Inhalte verwendet. Ein Verzeichnis, das entsprechend diesem Format aufgebaut ist, wird Bag genannt. Das Format wurde an der California Digital Library sowie Library of Congress entwickelt[1] und liegt aktuell als IETF-Entwurf[2] vor.

Spezifikation

Eine Bag muss aus dem Payload-Verzeichnis "data" sowie den Metadatendateien "bagit.txt" sowie "manifest-<alg>.txt" bestehen. Die zu sichernden Inhalte müssen im Verzeichnis "data" abgelegt sein. BagIt bezeichnet Metadatendateien als "Tags". Die Tag-Datei "bagit.txt" enthält immer zwei Zeilen, wovon die erste die BagIt-Version benennt, die zweite Zeile die Kodierung der Tagdateien, die immer UTF-8 sein muss. In der Datei manifest-<alg>.txt werden alle Dateien, die sich im Payloadverzeichnis befinden, zusammen mit einer Prüfsumme aufgeführt. Der Name der Manifestdatei muss den Algorithmus enthalten, mit dem die Prüfsummen gebildet wurden.

Das folgende Beispiel zeigt eine Bag, deren Payloadverzeichnis eine JPG-Bilddatei enthält. Die Prüfsumme wurde mittels des MD5-Algorithmus erstellt.

bag/
|
|-- data
|   \-- nyancat.jpg
|
|-- manifest-md5.txt
|     51afb385ha019f34b671a3f0a615fae1 data/nyancat.jpg
|
\-- bagit.txt
      BagIt-version: 0.97
      Tag-File-Character-Encoding: UTF-8

Zusätzlich zu den zwei obligatorischen Metadatendateien nennt der Entwurf weitere fakultative Dateien und definiert deren Inhalt. Es ist außerdem möglich, eigene Tagdateien zu definieren.

Weblinks