Berkeley DB

aus Wikipedia, der freien Enzyklopädie
Berkeley DB
Basisdaten

Entwickler Oracle
Betriebssystem unixoide, Windows
Programmiersprache C
Kategorie Datenbankmanagementsystem
Lizenz Duales Lizenzsystem (Kommerziell und GNU AGPL v3.0, vor 6.0.20 Sleepycat)
https://www.oracle.com/database/berkeley-db/index.html

Die Berkeley-Datenbank (Berkeley DB) ist eine eingebettete Datenbank-Bibliothek mit Programmierschnittstellen zu C, C++, Java, Perl, Python, Tcl und weiteren Programmiersprachen.

Geschichte

Die Berkeley DB entstand ab dem Jahr 1991 an der University of California, Berkeley, und wurde im Jahr 1992 als Berkeley DB 1.85 mit der Berkeley Software Distribution (BSD) veröffentlicht.[1] Im Jahr 1996 folgte die Berkeley DB 1.86 aus Harvard für Kerberos, ein Vertrag der ursprünglichen Entwickler mit Netscape, und deren Gründung von Sleepycat Software.[2] 2006 wurde Sleepycat durch Oracle aufgekauft.[3]

Eigenschaften

Berkeley DB läuft auf einer großen Anzahl von Betriebssystemen, unter anderem auf den meisten unixartigen und Windows-Systemen und auch Echtzeitbetriebssystemen.

Die Berkeley DB enthält Kompatibilitätsschnittstellen für einige historische Unix-Datenbankbibliotheken wie dbm, ndbm und hsearch.

Für die Verwendung in Java-Systemen wird eine Berkeley DB Java Edition angeboten, die als einzelne JAR-Datei in einer virtuellen Java-Maschine eingebunden werden kann. Sie bietet dieselben Funktionen wie die in C geschriebene Berkeley DB.

Berkeley DB XML ist eine Schnittstelle, die die Speicherung von XML-Daten in der in C geschriebenen Berkeley DB unterstützt. Dadurch können XML-Dokumente geparst und die Abfrage-Sprachen XPath und XQuery für Datenzugriffe genutzt werden.

Die Berkeley DB speichert Datensätze bestehend aus einem Schlüssel- und einem Datenteil. Eine weitere Strukturierung der Daten als einzelne Tabellenspalten mit bestimmten Datentypen wird nicht unterstützt.

Ab der Version 11G gibt es eine SQLite-kompatible SQL-Schnittstelle, mit der auf die gespeicherten Daten zugegriffen werden kann. Berkeley DB ist ausschließlich für die Verwendung als Eingebettetes Datenbanksystem konzipiert. Programme können die Datenbank nur durch prozessinterne API-Aufrufe verwenden, vergleichbar mit Zugriffen auf ein Dateisystem. Dadurch unterliegen die Programme, die die Berkeley DB als Datenspeicher verwenden, keinen Einschränkungen, in welcher Weise die Daten in einem Datensatz abgelegt werden. Ein Datensatz und sein zugehöriger Schlüssel kann bis zu vier Gigabyte groß sein. Eine Tabelle kann bis zu 256 Terabyte Speicher belegen.

Im Gegensatz zu einem Dateisystem bietet die Berkeley DB viele Funktionen, die ein Datenbanksystem charakterisieren. Sie bietet simultane Threads zum Manipulieren der Daten. Sie bietet Transaktionssicherheit für lesende und schreibende Zugriffe, Lock-Mechanismen, eine XA-Schnittstelle, Backups zur Laufzeit (Hot-Backup) und Replikation.

Die Berkeley DB benutzt denselben Adressraum, den auch die Anwendung verwendet, in die die Datenbank eingebettet ist. Das bedeutet einen Performance-Vorteil gegenüber großen Server-DBMS, die die angeforderten Daten vom permanenten Speichermedium erst in den eigenen Arbeitsspeicher lesen müssen und dann an den Adressraum der Anwendung übergeben muss. Mit einer Größe des Maschinencodes von weniger als 500 kB eignet sich die Berkeley DB auch gut für den Einsatz in Systemen mit einer schwachen Rechnerleistung.

Berkeley DB bietet zwar selbst keine Schnittstellen für Netzwerk-Zugriffe, besitzt aber Replikations-Funktionen für den Einsatz z. B. auf Bladeservern. Ein Blade-Computer fungiert dabei als Master, der Datenänderungen entgegennimmt und diese auf die Replika-Blades verteilt. Dadurch entsteht eine hohe Ausfallsicherheit des Gesamtsystems. Nach Angaben des Herstellers kann durch die Replikation eine Verfügbarkeit von 99,999 % des Gesamtsystems erreicht werden.

Weil die Berkeley DB nicht den Overhead einer großen Server-DB hat, ist auch die erforderliche Administration sehr einfach. Die Datenbank kann sehr variabel konfiguriert werden. Sie ist besonders gut geeignet für den Einsatz in geschlossenen Systemen, die überhaupt keine Administration erfordern bzw. ermöglichen. Bei einem Fehler des Systems startet sich das System selbständig neu und die Betriebsfähigkeit ist in den meisten Fällen wiederhergestellt.

Nutzer

Berkeley DB wird nach Angaben von Oracle mehr als 200 Millionen Mal eingesetzt,[4] unter anderem von namhaften Telekommunikations-, Netzwerk- und Hardwareanbietern:

Berkeley DB wird häufig in folgenden Systemen eingesetzt:

Nachfolgend eine Liste von beachtenswerten Programmen, die Berkeley DB zur Datenspeicherung verwenden:

Die folgenden Programme haben Berkeley DB in der Vergangenheit zur Datenspeicherung verwendet. Die Unterstützung soll jedoch in künftigen Versionen aufgegeben werden oder wurde bereits aufgegeben:

  • Movable Type – Ein freies Blog-Publikationssystem, das vom in Kalifornien ansässigen Six Apart entwickelt worden ist[6]
  • MySQL – Bis Version 5.1.12 konnte Berkeley DB als Speicher-Engine für Tabellen verwendet werden[7]
  • OpenLDAP – Eine freie Open-Source-Implementierung des Lightweight Directory Access Protocol (LDAP), die Verwendung von Berkeley DB wird jedoch zugunsten von LMDB nicht mehr empfohlen, entsprechend soll die Unterstützung eingestellt werden[8]
  • Subversion – eine Open-Source-Software zur Versionsverwaltung, die Verwendung von Berkeley DB für die Speicherung der Versionsdaten wird jedoch nicht mehr empfohlen, entsprechend soll die Unterstützung eingestellt werden[9]

Lizenzierung

Die Versionen 2.0 und höher von Berkeley DB sind unter einer Duallizenz verfügbar.[10] Man hat die Wahl zwischen einer kommerziellen Lizenz und der Sleepycat, einer Open-Source-Lizenz. Nutzer, die die DB mit proprietärer Software ausliefern wollen, müssen sich lizenzieren lassen. Die Kosten belaufen sich dabei bei lebenslangen Lizenzen je nach Version pro Prozessor zwischen 180 USD und 13.800 USD (Stand September 2014) und enthalten lebenslange Updates sowie ein Jahr Support.[11]

Ab der Version 6.0 lizenziert Oracle alle Produkte der Berkeley DB Reihe unter der GNU AGPL v3.[12][13]

Die Versionen vor 2.0 stehen unter der BSD-Lizenz, womit sie auch kommerziell frei genutzt werden können.

Einzelnachweise

Weblinks