Harter Link

aus Wikipedia, der freien Enzyklopädie

Harter Link (auch harte Verknüpfung; englisch hard link, im deutschen Fachjargon auch Hardlink) ist ein Begriff aus dem Bereich der Dateisysteme in der Informatik.

In modernen Dateisystemen gibt es keine feste Zuordnung zwischen Dateinamen und der eigentlichen Datei. Vielmehr wird beim Erstellen der Datei – beispielsweise auf einer Festplatte – zunächst bloß eine Nummer als Referenz auf die Datei benutzt (je nach Betriebssystem Inode- oder File-Record-Nummer genannt) und in einem zweiten Schritt ein Verzeichniseintrag mit dem Dateinamen erzeugt, der auf diese Nummer verweist. Im eigentlichen Sinne bezeichnet harter Link diese Verknüpfung von Dateiname und Datei (letztere repräsentiert durch Inode- oder File-Record-Nummer).

Interessant dabei ist – und das ist meistens gemeint, wenn der Begriff harter Link benutzt wird –, dass mehrere harte Links auf dieselbe Datei verweisen können, also mehrere Verzeichniseinträge bzw. Dateinamen für ein und dieselbe Datei existieren können.

Einführung

Den ersten harten Link erzeugt das Betriebssystem (genauer: der Dateisystemhandler) automatisch beim Erstellen der Datei, da ohne ihn gar kein Dateiname existieren würde und somit die Anwendungsprogramme gar keinen Zugriff auf die Datei hätten.

Mit der Erstellung eines harten Links auf eine bereits existierende Datei wird ein weiterer Name (zuweilen in einem anderen Verzeichnis) zu der Datei etabliert; anschließend bilden beide Namen einen gleichwertigen Zugang zu der Datei; dabei ist nicht ohne Weiteres zu sagen, welcher Name zuerst da war. Das ist ein Gegensatz zu Verfahren mit ähnlicher Zielsetzung wie z. B. symbolischen Verknüpfungen (auch Soft Links genannt), bei denen es eine eigentliche Datei und einen Link auf dieselbe gibt.

Eine Datei oder ein Verzeichnis kann mit diesem Mechanismus an verschiedenen Orten in der Verzeichnisstruktur gleichzeitig erscheinen. Zu einem weiteren harten Link gehört nur ein weiterer Name; andere Metadaten, die zur Datei gehören – wie etwa Änderungsdatum oder Zugriffsrechte –, existieren nur einmal und werden im Inode oder File Record gespeichert.[1][2][3]

Harte Links können sowohl in Unix- und Linux-Systemen (also auch macOS) als auch im Dateisystem NTFS unter Windows erstellt werden.

Im Allgemeinen spricht man von harten Links, wenn mehrere Einträge auf denselben Inode oder File Record verweisen, dessen Nummer eine Datei oder ein Verzeichnis dateisystemintern identifiziert. Mehrere harte Links auf denselben Inode oder File Record sind gleichwertig und können in beliebiger Reihenfolge umbenannt oder gelöscht werden. (Beim Löschen wird überprüft, ob gerade der letzte verbleibende harte Link gelöscht wird; die eigentliche Datei wird erst dann gelöscht.) Abgesehen von den Verzeichniseinträgen für das aktuelle und das übergeordnete Verzeichnis („.“ und „..“) verweisen harte Links fast immer auf Dateien.

Da Inode- oder File-Record-Nummern innerhalb von Partitionen verwaltet werden, sind harte Links nur innerhalb derselben Partition möglich. Möchte man Dateien auf verschiedenen Partitionen verlinken, so muss auf symbolische Links zurückgegriffen werden.

Aufbau (Unix)

Jeder Verzeichniseintrag besteht aus dem Dateinamen und der zugeordneten Inode-Nummer. Zu jedem Inode kann es nahezu beliebig viele Dateipfade (Verzeichniseinträge) geben, also auch unterschiedliche Namen für dieselbe Datei.

Ein Vorteil dieses Konzepts zeigt sich beim Entfernen von Links:

Es gibt bei Unixsystemen streng genommen keine Operation zum Löschen einer Datei, sondern nur eine unlink-Operation zum Löschen von Links. Im Inode einer Datei wird die aktuelle Anzahl der Links gespeichert. Erst wenn der letzte Link zu einer Datei gelöscht ist, der Zähler im Inode also den Wert Null hat, wird die Datei selbst (Inode und Datencluster) zur Wiederbeschreibung freigegeben und damit logisch gelöscht.

Bemerkenswert ist das Verhalten harter Links, wenn ein Benutzer eine Datei zu löschen versucht, die ein (oder mehrere) Programme noch geöffnet halten: Da das Öffnen einer Datei den Zähler um eins erhöht, führt das versuchte Löschen zwar zum „Verschwinden“ der Datei (genauer: des gelöschten Links) aus dem Verzeichnis. Die Datei existiert jedoch noch und kann vom Programm benutzt werden, solange es die Datei nicht schließt. Erst nachdem alle Programme die Datei geschlossen haben, wird auch der betreffende Festplattenspeicher freigegeben.

Um Konsistenzprobleme zu vermeiden, dürfen gewöhnliche Benutzer für Verzeichnisse keine zusätzlichen harten Links erstellen: Die Links werden von einem Verzeichnis-Inode automatisch verwaltet, und der eindeutige eigentliche Verzeichnisname taucht als Link genau einmal im übergeordneten Verzeichnis auf. Daneben gibt es in jedem Verzeichnis immer folgende zwei Links: Einen Link namens „.“, der das Verzeichnis selbst darstellt und folglich darauf verlinkt, sowie das übergeordnete Verzeichnis, durch einen Link namens „..“ repräsentiert.

Anwendungsbeispiele

Unix

Für sonstige Dateien lassen sich mit dem Befehl ln jederzeit zusätzliche Links erstellen, z. B. ein Link /home/wiki2/same-picture zur vorhandenen Datei /home/wiki1/picture:

ln /home/wiki1/picture /home/wiki2/same-picture

Andere Möglichkeiten zum Erstellen von Hard Links sind cp --link und rsync --link-dest.

Mit dem Befehl stat lässt sich ermitteln, wie viele harte Links auf eine Datei zeigen. Der Befehl ls -l zeigt auf vielen Unix-Systemen in der zweiten Spalte die Anzahl harter Links der zugehörigen Datei.

Windows

Harte Links werden auf Partitionen mit dem NTFS-Dateisystem unterstützt, nicht jedoch auf FAT- oder ReFS-formatierten Partitionen. Je Datei sind bis zu 1023 (=) zusätzliche harte Links möglich. Der erste [feste/harte] Verweis (oder

[hard]link

) zeigt immer auf die bereits angelegte und damit erreichbare/zugreifbare Datei.[4] Zur Erstellung eignen sich z. B. das (u. a. in Windows XP enthaltene) Werkzeug

fsutil

(u. a. mit der Befehlserweiterung

hardlink create

), der (ab Vista enthaltene) Befehl

mklink

(mit dem Parameter /H, siehe folgende Beispiele) oder Anwendungen anderer Hersteller.

Um mit dem Microsoft-Werkzeug fsutil den harten Link „Neue Linkdatei.txt“ zu erzeugen, der auch auf die Datei „Zieldatei.txt“ verweist, ist folgender Befehl einzugeben:

C:\>fsutil hardlink create "Neue Linkdatei.txt" "Zieldatei.txt"

oder ab Vista:

C:\>mklink /H "Neue Linkdatei.txt" "Zieldatei.txt"

Anders als unter Unix und Unixähnlichen kann kein harter Link gelöscht werden, solange die betreffende Datei von einer Anwendung geöffnet (d. h. ein Filehandle darauf gesetzt) ist.

Anmerkungen

  • Ein typischer Arbeitsgang an einem Computer ist es, eine Datei zu öffnen, zu ändern und zu speichern – beispielsweise einen Brief in einer Textverarbeitung zu ändern und dann zu sichern. Je nachdem, wie die Anwendungssoftware – hier die Textverarbeitung – intern ausgelegt ist, wird entweder der alte Inhalt in der geöffneten Datei mit dem geänderten Inhalt überschrieben – oder es wird eine neue Datei mit temporärem Namen angelegt, die alte gelöscht und anschließend die neue Datei mit dem alten Namen versehen. Entsprechend der dargelegten Eigenschaften von harten Links wird beim erstgenannten Verfahren der neue Inhalt bei allen Links der Datei erscheinen; beim zweiten Verfahren hingegen wird durch den Löschvorgang lediglich einer der Links aufgehoben, und der neue Inhalt erscheint in einer neuen Datei ohne weitere harte Links. Die anderen Links der ursprünglichen Datei verweisen nach wie vor auf ebenjene ursprüngliche Datei mit dem alten Inhalt; es sind nun also beide Versionsstände auf dem Datenträger vorhanden – ein Effekt, der gewollt sein kann oder auch nicht.
  • Harte Links werden bei der Datensicherung (backup) durch Kopien der verlinkten Dateien ersetzt, sofern das Backup-Programm diesen Fall nicht besonders behandelt.
  • Für mehrfache Verweise auf eine Datei stehen auch symbolische Links (Softlinks) zur Verfügung.
  • Eine verbreitete Anwendung von harten Links ist die Erstellung von Schnappschüssen. Dabei werden statt einer vollständigen Kopie aller Dateien (complete backup) nur neue oder geänderte Dateien gesichert (incremental backup) und ältere Dateien als harte Links auf bereits vormals gesicherte Dateien (backup set) repräsentiert. Da harte Links kaum Speicherplatz benötigen, wird gegenüber einer vollständigen Sicherung entsprechend signifikant wenig Speicher benötigt, trotzdem lassen sich alle Veränderungen an einem Verzeichnisbaum rekonstruieren.[5][6]
  • Das Versionsverwaltungssystem Git benutzt harte Links beim Klonen von lokalen Repositories. Da Git in der Regel die gesamte Historie eines Projekts lokal verfügbar hält, lässt sich auf diese Weise Speicherplatz sparen.[7]
  • Unter NTFS erfüllen Abzweigungspunkte (
    junctions
    )
    eine ähnliche Funktion wie harte Links, wenn Verzeichnisse auf verschiedenen Partitionen oder Festplatten desselben Computers verlinkt werden sollen. Abzweigungspunkte erlauben jedoch keine Verlinkung von Dateinamen oder Verlinkungen über Netzlaufwerke.

Siehe auch

Einzelnachweise

  1. Vivek Gite: Understanding UNIX / Linux filesystem Inodes. 10. November 2005, abgerufen am 15. Mai 2016.
  2. Raymond Chen: Why is the file size reported incorrectly for files that are still being written to? MSDN, 26. Dezember 2011, abgerufen am 15. Mai 2016.
  3. joscon, The Windows Servicing Guy: How hard links work. Microsoft TechNet, 6. Januar 2011, abgerufen am 15. Mai 2016.
  4. directory of hardlinks on NTFS appears to be consuming more space than it should. Stack Overflow, abgerufen am 18. Mai 2021 (englisch).
  5. Mike Rubel: Easy Automated Snapshot-Style Backups with Linux and Rsync. 4. Januar 2004, abgerufen am 15. Mai 2016.
  6. Rob Flickenger: Linux Server Hacks. O’Reilly Media, 2003, ISBN 978-0-596-00461-3, Hack 42: Automated Snapshot-Style Incremental Backups with rsync, S. 242 (oreilly.com).
  7. git-clone(1) Manual Page. 6. Juni 2015, abgerufen am 15. Mai 2016.