PostgreSQL

aus Wikipedia, der freien Enzyklopädie
Dies ist die aktuelle Version dieser Seite, zuletzt bearbeitet am 22. Juli 2022 um 16:50 Uhr durch imported>Kristbaum(1892621) (nutzung des SVGs von commons).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
PostgreSQL
Basisdaten

Entwickler PostgreSQL Global Development Group
Betriebssystem Unix-Derivate, Linux, Windows, macOS
Kategorie Datenbanksystem, Server
Lizenz PostgreSQL Lizenz[1] vergleichbar der BSD-Lizenz oder der MIT-Lizenz
deutschsprachig nein
www.postgresql.org

PostgreSQL (englisch [,pəʊstgɹɛs kjʊ'ɛl])[2], oft kurz Postgres genannt[3], ist ein freies, objektrelationales Datenbankmanagementsystem (ORDBMS). Seine Entwicklung begann in den 1980er Jahren, seit 1997 wird die Software von einer Open-Source-Community weiterentwickelt.

PostgreSQL ist weitgehend konform mit dem SQL-Standard SQL:2011,[4] d. h. der Großteil der Funktionen ist verfügbar und verhält sich wie definiert. PostgreSQL ist vollständig ACID-konform (inklusive der Data Definition Language) und unterstützt erweiterbare Datentypen, Operatoren, Funktionen und Aggregate[5]. Obwohl sich die Entwicklergemeinde sehr eng an den SQL-Standard hält, gibt es dennoch eine Reihe von PostgreSQL-spezifischen Funktionalitäten, wobei in der Dokumentation bei jeder Eigenschaft ein Hinweis erfolgt, ob dies dem SQL-Standard entspricht, oder ob es sich um eine spezifische Erweiterung handelt. Darüber hinaus verfügt PostgreSQL über ein umfangreiches Angebot an Erweiterungen durch Dritthersteller, wie z. B. PostGIS zur Verwaltung von Geodaten.

PostgreSQL ist in den meisten Linux-Distributionen enthalten. Apple liefert von der Version Mac OS X Lion (10.7) an PostgreSQL als Standarddatenbank aus.

Geschichte

PostgreSQL-Zeitleiste

PostgreSQL, zuvor bekannt unter dem Namen Postgres, später Postgres95, entstand aus einer Datenbankentwicklung der University of California in Berkeley. Den Anfang stellte dabei das Ingres-Projekt dar, wobei der Hauptverantwortliche Michael Stonebraker 1982 die Universität verließ, um Ingres kommerziell zu vertreiben. Nachdem Stonebraker 1985 wieder zur Universität zurückgekehrt war, startete er das Post-Ingres-Projekt, um die Probleme der damaligen Datenbankmanagementsysteme zu korrigieren. Die Codebasis des ersten Postgres ist dabei eine andere als die von Ingres.

1989 wurde die erste Version von Postgres fertiggestellt.

Im Jahre 1994 wurde Postgres von den Studenten Andrew Yu und Jolly Chen um einen SQL-Interpreter erweitert und die Software als Open Source unter dem Namen Postgres95 freigegeben. Der Postgres95-Code entsprach dem ANSI-C-Standard und wurde um 25 % verkleinert, weiterhin wurden Leistung und Zuverlässigkeit verbessert. Postgres95, Version 1.0.x war im Wisconsin Benchmark 30 bis 50 Prozent schneller als Postgres, Version 4.2.

Im Zuge der Entwicklung des World Wide Web verstärkte sich das Interesse an Datenbanken. 1996 erhielt Postgres seinen neuen Namen PostgreSQL. Die erste unter diesem Namen veröffentlichte Version ist 6.0. Seither wurde PostgreSQL fortlaufend weiterentwickelt.

Eigenschaften

  • Umfassendes Transaktionskonzept, das Multiversion Concurrency Control (MVCC) unterstützt
  • Ermöglicht komplexe Abfragen mit Unterabfragen (Subselects), auch geschachtelt
  • Referentielle Integrität (u. a. Constraints, Fremdschlüssel)
  • Mengenoperationen
  • Vererbung von Tabellen
  • Maximale Datenbankgröße nur durch zur Verfügung stehenden Speicher begrenzt
  • Views, die mit Hilfe von Regeln (Rules und Triggers) auch schreibfähig sein können (Updatable Views)
  • Trigger und gespeicherte Prozeduren (stored procedures) sind in verschiedenen Sprachen möglich: PL/pgSQL, PL/c, PL/Tcl, PL/Python, PL/Perl, PL/Java, PL/PHP, PL/Ruby, PL/R, PL/sh, PL/Scheme, PL/Parrot, PL/V8 (derzeit noch experimentell)
  • Schnittstellen zu vielen Programmiersprachen, u. a. C, C++, Object Pascal, Java/JDBC, Tcl, PHP, Perl, Python, Ruby sowie zu ODBC und .Net-Framework
  • Lauffähig auf vielen Unix-Plattformen, von Version 8.0 an auch nativ unter Windows
  • Export und Import sowohl von Daten als auch von Datenbankstrukturen (Schemata)
  • Erweiterbarkeit durch Funktionen, selbstdefinierbare Datentypen und Operatoren
  • Asynchrone und synchrone Replikation. Der Vorteil der synchronen Replikation liegt in der Sicherstellung, dass die Transaktion mindestens auf zwei Servern tatsächlich ausgeführt wurde, womit eine vollständige Sicherung jederzeit garantiert werden kann (Hot Standby). Diese Ausfallsicherheit wird naturgemäß durch eine längere Wartezeit auf das Commit erkauft. Daher gibt es auch die Möglichkeit, besonders wichtige Geschäftsprozesse wie finanzielle Transaktionen synchron zu replizieren, und bei weniger wichtigen Transaktionen, wie der Aufzeichnung der Benutzerinteraktionen, die sehr viel schnellere asynchrone Replikation zu nutzen.

Erweiterungen

Eine Reihe von durch den Benutzer zu installierenden Zusatzmodulen steht zur Verfügung, darunter mit GiST (Generalized Search Tree) eine universelle Schnittstelle, um Such- und Sortierverfahren in weiten Grenzen selbst definieren zu können. Eine Anwendung davon ist PostGIS, das geografische Objekte und Datenstrukturen verwalten und damit als Datenbank für Geoinformationssysteme (GIS) dienen kann. Eine andere GiST-Anwendung ist OpenFTS (Open Source Full Text Search), das Volltextsuche in DB-Objekten erlaubt.

Eine Reihe von Erweiterungen beschäftigt sich mit Clustering und Replizierung, dem parallelen Einsatz und Abgleich verteilter DB-Server.

Grenzwerte

In diesem Abschnitt werden einige Beschränkungen einer älteren Version beschrieben. Da inzwischen neuere Releases bereitgestellt wurden, könnten einige davon weggefallen sein.

Die hier beschriebenen Beschränkungen betreffen die Versionen 8.4 bis 9.5:[6]

  • maximale Größe der Datenbank: unbeschränkt
  • maximale Größe einer Tabelle: 32 TB
  • maximale Größe eines Datensatzes: 1,6 TB
  • maximale Größe einer Zelle: 1 GB
  • maximale Anzahl Zeilen pro Tabelle: unbeschränkt
  • VARCHAR- und TEXT-Spalten können nicht größer als 1 GB sein
  • Die maximale Anzahl der Spalten pro Tabelle ist abhängig von den verwendeten Datentypen und liegt zwischen 250 und 1600

Upgrade der Datenbank

Jede Nebenversionsnummer wird von der PostgreSQL-Entwickler-Community fünf Jahre lang weitergepflegt. Revisionen enthalten Leistungsverbesserungen und Fehlerbereinigungen, aber niemals neue Funktionen. Die älteste derzeit (Stand 06/2022) noch gepflegte Versionslinie ist 10, die im Oktober 2017 erschien.[7]

Bei einer Software-Aktualisierung müssen bestehende Datenbanken vorher gesichert, danach in der neuen PostgreSQL-Version neu angelegt und die Daten aus der vorherigen Sicherung eingespielt werden. Dies ist dann erforderlich, wenn sich die zweite oder erste Stelle der Versionsnummer geändert hat, nicht jedoch bei Änderungen der dritten Stelle.

Alle heute unterstützten Versionen liefern ein Werkzeug namens pg_upgrade[8] mit, welches das Datenverzeichnis ohne das vorher notwendige Sichern und Wiedereinspielen der Datenbank aktualisieren kann.

Nach einem Import einer Datenbank sollte der Befehl „Analyse“ ausgeführt werden, damit die Analyse Tabelle „pg_statistic“ richtig befüllt wird. Unterbleibt eine „Analyse“ kann dies zu Performanzproblemen führen.[9] Auch wird geraten diesen Befehl einmal am Tag zu betriebsarmen Zeiten durchzuführen, um die Performanz zu erhalten. Auch sollte der Befehl „Vakuum“ regelmäßig ausgeführt werden, um die Datenbankgröße zu beschränken.[10]

Versionen

Version Veröffentlicht am Beschreibung / Anmerkung
7.4 17. November 2003
8.0 19. Januar 2005 Von der Version 8.0 an unterstützt PostgreSQL Windows. Eine weitere Neuerung ist die Unterstützung von Sicherungspunkten (Savepoints). Mit diesen ist es möglich, eine Transaktion an einem vorher gespeicherten Sicherungspunkt fortzusetzen, falls diese durch einen Fehler abgebrochen wurde.
8.3 Februar 2008 Version 8.3 brachte eine Reihe von Leistungsverbesserungen sowie Funktionserweiterungen, darunter:
  • Volltextsuche, die bisher als Zusatzprodukt verfügbar war, ist nun in den Kern der DB integriert.
  • XML-Verarbeitung wird durch einen XML-Datentypen unterstützt, der jeweils ein XML-Dokument enthält; bei Abfragen können nun etwa SQL- mit XPath-Queries in einer Transaktion kombiniert werden. Dieses Verfahren wurde 2006 bei DB2 von IBM vorgestellt.
  • Datentypen ENUM und UUID.
9.0 September 2010 Version 9.0 brachte Funktionen für Replikation und Hot-Standby und Verbesserungen bei Sicherheit, Monitoring und speziellen Datentypen.[11]
9.1 12. September 2011 Version 9.1 brachte eine Verbesserung der Hochverfügbarkeit bei Betrieb von mehreren Servern mit Hilfe synchroner Replikation, Zugriff auf fremde Datenquellen, spaltenweise linguistisch korrekte Sortierbarkeit, Einbindung von Erweiterungen sowie eine Reihe weiterer Verbesserungen.[12]
9.2 10. September 2012 Version 9.2 enthält in erster Linie neue Funktionalitäten zur Verbesserung der Performance.[13]
9.3 9. September 2013 Wesentliche Verbesserungen sind im Bereich der Unterstützung von JSON, bei materialisierten Views und beschreibbaren Views.
9.4 18. Dezember 2014 Beschleunigte Verarbeitung von JSON-Daten durch das binäre Format JSONB.
9.5 7. Januar 2016 Row-level security control, Block Range Indexes (BRIN), IMPORT FOREIGN SCHEMA, pg_rewind hinzugefügt.[14]
9.6 29. September 2016 Die wichtigsten Änderungen betreffen vertikale („scale-up“) als auch horizontale („scale-out“) Skalierung, parallelisierte Abfragen, Phrasensuche und Verbesserungen bei synchroner Replikation, sowie generelle verbesserte Performance und Benutzerfreundlichkeit.[15]
10 5. Oktober 2017 Die wichtigsten Änderungen betreffen deklarative Partitionierung, logische Replikation, verbesserte Abfrage-Parallelisierung und bessere Password-Hashes.[16]
11 18. Oktober 2018[17] Es wurde weiter die Robustheit und die Leistung für die Partitionierung, die Unterstützung von Transaktionen in gespeicherten Prozeduren und die Abfrageparallelität in parallel laufenden Abfragen verbessert. Es gibt nun auch eine Just-in-Time-Kompilierung (JIT) für Ausdrücke.
11.3 9. Mai 2019[18]
11.4 20. Juni 2019[19]
11.5 8. August 2019[20]
12 3. Oktober 2019 Verbesserung in der Abfragegeschwindigkeit und Abfrage von SQL/JSON-Ausdrücken. Mit dieser Version ist es nun auch möglich, das Table-Storage auszutauschen.[21]
13 25. September 2020[22]
14 30. September 2021 Die Veränderungen betreffen:
  • Komfort beim Umgang mit JSON-Daten und Multi-Ranges
  • Performance für ressourcenintensive Lasten
  • Verbesserungen für verteilte Datenbanken, Administration und Fortschrittsanalyse
  • SQL Performance, Konformität und Komfort
  • Sicherheit (vordefinierte Rollen, Passwortstandard SCRAM-SHA-256 als Standard)[23]

Softwarewerkzeuge

PostgreSQL selbst läuft als Hintergrundprozess und kann auf verschiedene Weise interaktiv bedient werden. Für die kommandozeilenorientierte Bedienung wird die Konsolenanwendung psql mit der Installation mitgeliefert. Programme mit grafischer Benutzeroberfläche zur Bedienung und Verwaltung der Datenbank müssen oft gesondert installiert werden: freie Produkte sind etwa PgAdmin[24] und phpPgAdmin. Daneben werden eine Vielzahl von kommerziellen Werkzeugen angeboten, die auch grafische CASE-Modellierung, Im- und Export-Funktionen oder DB-Monitoring bieten. Ein MySQL-Migrationshilfswerkzeug ist in jedem freien PostgreSQL-Downloadpaket von EnterpriseDB[25] enthalten.

Ein wichtiges Werkzeug zur Konfiguration der Datenbank ist das Python Script „pgtune“.[26] Die Standardeinstellungen der Datenbank sind oftmals nicht auf die verwendete Hardware angepasst. „pgtune“ zeigt Lösungsvorschläge auf, wie man die Datenbank „tunen“ kann, um die Leistung der Datenbank deutlich zu steigern. Es gibt ein Online Tool um die wichtigsten Einstellungen der Datenbank zu ermitteln.[27] Anfänger tun sich oftmals schwer die geeigneten Konfigurationsparameter zu ermitteln.[28] Ohne geeignete Konfiguration ist die Datenbank oftmals wenig performant.[29] Das Tool wurde ursprünglich von Greg Smith (2ndQuadrant) entwickelt.

Preise und Auszeichnungen

An PostgreSQL wurden in der Vergangenheit zahlreiche Preise vergeben.[30] Nicht zuletzt erhielt das Projekt den Lifetime Achievement Award im Rahmen der OSCON 2019.[31][32]

Siehe auch

PyGreSQL, eine Python-Programmbibliothek für PostgreSQL

Literatur

  • Lutz Fröhlich: PostgreSQL 9. Praxisbuch für Administratoren und Entwickler. Hanser, München 2013, ISBN 978-3-446-42239-1.
  • Peter Eisentraut, Bernd Helmle: PostgreSQL-Administration. O’Reilly, 2013, ISBN 978-3-86899-361-5.
  • Ioannis Papakostas: Datenbankentwicklung mit PostgreSQL 9. TEIA AG – Internet Akademie und Lehrbuch Verlag, Berlin 2010, ISBN 978-3-942151-06-1.
  • Andreas Scherbaum: PostgreSQL. Datenbankpraxis für Anwender, Administratoren und Entwickler. Open Source Press, München 2009, ISBN 978-3-937514-69-7.

Weblinks

Commons: PostgreSQL – Sammlung von Bildern, Videos und Audiodateien

Produkt

Werkzeuge und Erläuterungen

Einzelnachweise

  1. PostgreSQL: License. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  2. Hörbeispiel zur Aussprache von „PostgreSQL“ (MP3-Datei; 5,6 kB)
  3. PostgreSQL-FAQ. What is PostgreSQL? How is it pronounced? What is Postgres? In: wiki.postgresql.org. Abgerufen am 27. August 2015 (englisch).
  4. PostgreSQL: Documentation: 10: Appendix D. SQL Conformance. In: PostgreSQL.org. Abgerufen am 8. November 2017 (englisch).
  5. PostgreSQL: Feature Matrix. In: PostgreSQL.org. Abgerufen am 19. Mai 2012 (englisch).
  6. PostgreSQL: About. In: PostgreSQL.org. Abgerufen am 11. April 2012 (englisch).
  7. PostgreSQL: Versioning Policy. Abgerufen am 15. Juni 2022 (englisch).
  8. pg_upgrade — upgrade a PostgreSQL server instance. PostgreSQL Server Applications. In: PostgreSQL Documentation. The PostgreSQL Global Development Group, abgerufen am 24. Oktober 2021 (englisch).
  9. ANALYZE — collect statistics about a database. SQL Commands. In: PostgreSQL Documentation. The PostgreSQL Global Development Group, abgerufen am 24. Oktober 2021 (englisch).
  10. VACUUM — garbage-collect and optionally analyze a database. SQL Commands. In: PostgreSQL Documentation. The PostgreSQL Global Development Group, abgerufen am 24. Oktober 2021 (englisch).
  11. PostgreSQL 9.0 mit eingebauter Replikation. In: heise online. 20. September 2010, abgerufen am 11. April 2012.
  12. PostgreSQL 9.1 erschienen – Artikel bei Golem.de, vom 16. September 2011.
  13. PostgreSQL 9.2: Release Notes – PostgreSQL-Online-Dokumentation, vom 10. September 2012.
  14. http://www.postgresql.org/docs/9.5/static/release-9-5.html
  15. http://www.postgresql.org/docs/9.6/static/release-9-6.html
  16. PostgreSQL: Documentation: 10: E.1. Release 10. Abgerufen am 9. Oktober 2017 (englisch).
  17. PostgreSQL: Documentation: 11: E.1. Release 11. Abgerufen am 19. Oktober 2018 (englisch).
  18. PostgreSQL 11.3, 10.8, 9.6.13, 9.5.17, and 9.4.22 Released! Abgerufen am 17. Juni 2019.
  19. PostgreSQL 11.4, 10.9, 9.6.14, 9.5.18, 9.4.23, and 12 Beta 2 Released. 20. Juni 2019, abgerufen am 27. Juni 2019 (englisch).
  20. PostgreSQL: Documentation: 11: E.1. Release 11.5. Abgerufen am 13. Oktober 2019.
  21. PostgreSQL: Documentation: 12: E.1. Release 12. Abgerufen am 13. Oktober 2019.
  22. PostgreSQL 13 Released! Abgerufen am 25. September 2020.
  23. PostgreSQL 14 Press Kit. The PostgreSQL Global Development Group, 30. September 2021, abgerufen am 24. Oktober 2021 (deutsch).
  24. pgadmin.org (englisch).
  25. Downloadseite für PostgreSQL. Abgerufen am 24. September 2011.
  26. Alternatives – ClusterControl PostgreSQL Configuration
  27. Tool pgtune
  28. If you are new to PostgreSQL the most common challenge you face is about how to tune up your database environment.
  29. Sourcen des Online Tools
  30. Liste der Auszeichnungen (Memento vom 1. März 2012 im Internet Archive) auf der Projektseite.
  31. O'Reilly OSCON on Twitter. 18. Juli 2019, abgerufen am 27. März 2021.
  32. Mark Wong: PostgreSQL Award. EnterpriseDB, 23. Juli 2019, abgerufen am 27. März 2021.