Open Data

aus Wikipedia, der freien Enzyklopädie

Als Open Data (aus englisch open data ‚offene Daten‘) werden Daten bezeichnet, die von jedermann zu jedem Zweck genutzt, weiterverbreitet und weiterverwendet werden dürfen.[1] Einschränkungen der Nutzung sind nur erlaubt, um Ursprung und Offenheit des Wissens zu sichern, beispielsweise durch Nennung des Urhebers oder die Verwendung einer Share-alike-Klausel.[2] Solch eine Einschränkung ist nur dann möglich, wenn die Daten durch Immaterialgüterrechte geschützt sind.[3][4]

Die Forderung danach beruht auf der Annahme, dass frei nutzbare Daten zu mehr Transparenz und Zusammenarbeit führen. Der volkswirtschaftliche Wert offener Daten aus der öffentlichen Verwaltung wurde 2016 von der Konrad-Adenauer-Stiftung auf jährlich 43,1 Milliarden Euro geschätzt.[5] Um die Nachnutzbarkeit zu gewährleisten, werden Freie Lizenzen verwendet. Die Open-Data-Bewegung ist im Umfeld der Wissensallmende anzusiedeln und teilt viele Argumente mit den artverwandten Themen Open Source, Open Hardware, Open Content, Open Access, Open Science und Open Education. Die Bereitstellung offener Daten durch die öffentliche Hand wird als eine Voraussetzung für Open Government angesehen.

Definition

Offene Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht werden.[1] Die wissenschaftliche Literatur zitiert beispielhaft Lehrmaterial, Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen, medizinische Forschungsergebnisse oder Hörfunk- und Fernsehsendungen.[1] Bei Open Data kann es sich über Datenbestände staatlicher Stellen hinaus auch um Daten privatwirtschaftlich agierender Unternehmen, Hochschulen sowie Non-Profit-Einrichtungen handeln.[6]

Eine ausführlichere Definition der Kriterien für offene Daten wurde erstmals 2006 von der Open Knowledge Foundation in der Offen-Definition veröffentlicht.[2] Hervorzuheben ist, dass offene Daten keine personenbezogenen Daten oder dem Datenschutz unterliegende Daten beinhalten dürfen.[7]

Um die freie Nutzbarkeit offener Daten zu kennzeichnen, können geeignete freie Lizenzen verwendet werden. Lizenzen, die die Nutzung der Daten einschränken, beispielsweise, indem sie Veränderungen oder kommerzielle Nutzung untersagen, entsprechen nicht der Vereinbarung der „Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen“ und der Offen-Definition und gelten somit nicht als offene Daten.

Geschichte

Das Konzept hinter Open Data kann bis auf das Internationale Geophysikalische Jahr 1957/-58 zurückgeführt werden. Damaliges Ziel war, durch die Einrichtung von Datenaustauschzentren und die Standardisierung von Metadaten den Austausch und die Nutzung wissenschaftlicher Daten zu erleichtern.[8]

In den 1970er Jahren wird der Begriff erstmals in einer Verordnung erwähnt. Wenn internationale Partner die NASA durch Bodenkontrollstationen beim Betrieb amerikanischer Satelliten unterstützten, erforderten die internationalen Vereinbarungen, dass diese Partner eine Open-Data-Richtlinie (im Original open data policy) einführten. Diese Richtlinie musste vergleichbare Anforderungen an die öffentliche Verfügbarkeit von Daten machen wie die hauseigenen Richtlinien der NASA und anderer teilnehmender US-Einrichtungen. Auch das Format, in dem die Daten bereitgestellt wurden, wurde darin spezifiziert.[9]

1995 ging ein Bericht der National Academy of Sciences auf diese und vergleichbare Vereinbarungen zum Austausch wissenschaftlicher Daten ein:[10]

“International programs for global change research and environmental monitoring crucially depend on the principle of full and open exchange …. Experience has shown that increased access to scientific data, information, and related products has often led to significant scientific discoveries and the opportunity for educational enhancement.”

„Internationale Programme zur Erforschung der Weltveränderung und zur Umweltüberwachung hängen entscheidend vom Prinzip des vollständigen und offenen Austauschs ab… Die Erfahrung zeigt, dass gesteigerter Zugang zu wissenschaftlichen Daten, Informationen und verwandten Ergebnissen häufig zu signifikanten wissenschaftlichen Entdeckungen und zu Gelegenheiten für die Verbesserung der Bildung geführt hat.“

On the Full and Open Exchange of Scientific Data

Aus diesem Antrieb, wissenschaftliche Daten und Erkenntnisse frei teilen und nachnutzen zu können, entstand auch die Open-Access-Bewegung, die peer-reviewte Forschungsergebnisse der Allgemeinheit frei zugänglich machen möchte.

Der Open-Data-Begriff ist jedoch nicht nur auf wissenschaftliche Daten beschränkt. Die Konzepte Open Government und Open Data sind eng verwandt – in den Vereinigten Staaten wird zudem noch der Begriff Open Government Data verwendet, wobei dieser Begriff sowohl „Daten, die einer Open Government entstammen“ als auch „Offene Daten, die einer Regierung entstammen“ bedeuten kann.[9] In Ländern, in denen transparentes Regierungshandeln durch Informationsfreiheitsgesetze verbrieft ist, hatte die Bürgerschaft zwar rechtlichen Anspruch auf Daten aus Regierungshand, musste diese jedoch individuell anfragen. Ab der Verbreitung des World Wide Web in den 1990ern entstanden in Ländern mit Informationsfreiheitskultur Gesetzesinitiativen, Daten über Regierungshandeln auch ohne vorherige Anfrage maschinenlesbar im Netz zur Verfügung zu stellen.[9][11]

Open-Data-Gesetz

Im Jahr 2017 hat der Bundestag das sogenannte Open-Data-Gesetz beschlossen, wodurch Daten von unmittelbaren Bundesbehörden ab 13. Juli 2018 maschinenlesbar und entgeltfrei öffentlich zugänglich gemacht werden müssen.[12] Allerdings wurde kritisiert, dass es durch dieses Gesetz keinen Rechtsanspruch auf die Daten gibt und es weitreichende Ausnahmetatbestände für die Veröffentlichung von Daten gibt.[13] Die Bereitstellungspflicht für Open Data wird mit dem Zweiten Open-Data-Gesetz (Gesetz zur Änderung des E-Government-Gesetzes und zur Einführung des Gesetzes für die Nutzung von Daten des öffentlichen Sektors) auch auf alle mittelbaren Bundesbehörden sowie Forschungsdaten ausgeweitet.[12] Der Gesetzentwurf für das Zweite Open-Data-Gesetz wurde vom Bundeskabinett am 10. Februar 2021 beschlossen[14] und trat am 23. Juli 2021 als Datennutzungsgesetz in Kraft.[15]

November 2021 wurde im Koalitionsvertrag der Bundesregierung die Bedeutung der Veröffentlichung von Forschungsdaten hervorgehoben und ein Forschungsdatengesetz wird geplant.

„Das ungenutzte Potential, das in zahlreichen Forschungsdaten liegt, wollen wir effektiver für innovative Ideen nutzen. Den Zugang zu Forschungsdaten für öffentliche und private Forschung wollen wir mit einem Forschungsdatengesetz umfassend verbessern sowie vereinfachen und führen Forschungsklauseln ein.“[16]

Forderungen der Open-Data-Bewegung

Open Data bezieht sich speziell auf Informationen, außerhalb einer Textform, wie zum Beispiel Wetterdaten, Karten, Genomen oder medizinischen Daten. Da dieses Material von kommerziellem Interesse ist, kommt es hier oft zu Widerspruch. Befürworter von Open Data argumentieren jedoch, es handle sich dabei um Allgemeingut, und die freie Verwendung der Daten dürfe nicht durch Restriktionen behindert werden.

Ein typischer Fall, der die Notwendigkeit von Open Data zeigen soll:

“Numerous scientists have pointed out the irony that right at the historical moment when we have the technologies to permit worldwide availability and distributed process of scientific data, broadening collaboration and accelerating the pace and depth of discovery […] we are busy locking up that data and preventing the use of correspondingly advanced technologies on knowledge.”

„Viele Wissenschaftler haben die Ironie aufgezeigt, dass gerade jetzt, zu dem Zeitpunkt in der Geschichte, da wir die Technologien haben, die eine weltweite Verfügbarkeit von wissenschaftlichen Daten und verteilte Verarbeitung dieser ermöglichen, wo Zusammenarbeit vertieft werden und Entdeckungen beschleunigt werden können, dass genau zu diesem Zeitpunkt wir unsere Zeit darauf verwenden, ebendiese Daten verschlossen zu halten und dadurch die Anwendung ebenso fortschrittlicher Technologien zu ihrer Erschließung verhindern.“

John Wilbanks, Executive Director, Science Commons[17]

Datenerzeuger vernachlässigen oftmals die Notwendigkeit, Benutzerrechte festzulegen. Zum Beispiel kann eine fehlende (eventuell freie) Lizenzierung Daten unnötig von einer weiteren freien Verwendung ausschließen. Befürworter von Open Data argumentieren jedoch, dass es sich bei vielen potenziellen Datensätzen ohnehin um Faktendaten handle. Das heißt, dass den Daten keine für einen urheberrechtlichen Schutz notwendige individuelle geistige Schöpfung innewohne, sondern es sich um möglichst akkurate Abbildungen der Realität, beispielsweise durch Messungen, handle.[18]

Die Open-Data-Bewegung fordert nicht nur den freien Zugang zu Daten, sondern generiert diese auch selber. Ein Beispiel dafür ist OpenStreetMap. Befürworter behaupten, dass durch das Open-Data-Konzept auch eine demokratischere Gesellschaft möglich sei – so ermöglicht beispielsweise die englische Webseite TheyWorkForYou.com, das Abstimmungsverhalten der britischen Abgeordneten nachzuverfolgen.[19] Im Zusammenhang mit Daten, die eine Regierung betreffen, wird auch von Open Government gesprochen. Rob McKinnon sagte bei einem Vortrag auf der re:publica, dass „der Verlust des Datenprivilegs zu neuen Machtstrukturen innerhalb einer Gesellschaft führen kann“.[20] Ein weiteres Beispiel ist die Seite farmsubsidy.org, die zeigt, an wen EU-Agrarsubventionen gezahlt werden, die fast die Hälfte des Gesamtbudgets ausmachen. Speziell deutsche Politiker sperren sich seit langem, dass diese Informationen öffentlich werden.

Daten, die den Kriterien von Open Data genügen sollen, müssen strukturiert und maschinenlesbar zur Verfügung gestellt werden, so dass sie sich filtern, durchsuchen und von anderen Anwendungen weiterverarbeiten lassen können. Daten von Regierungsstellen zum Beispiel liegen oft als PDF vor und sind somit nicht ohne Probleme weiterzuverarbeiten.

Pro und Contra

Argumente für Open Data

  • „Daten gehören den Menschen“ – typische Beispiele: Genome, medizinische Forschung, umweltwissenschaftliche Daten.
  • Öffentliche Gelder haben die Generierung der Daten erst ermöglicht, also müssen sie auch öffentlich zugänglich sein (tatsächlich treten Wissenschaftler in der Regel die Rechte an den von ihnen generierten Daten an private Verlage ab, wenn sie ihre Ergebnisse publizieren).
  • Fakten können nicht dem Urheberrecht unterliegen.
  • Die durch freien Zugang und Verwendung der Daten ermöglichte Zusammenarbeit erweitert die verwendbaren Daten und den Nutzen für die Allgemeinheit und den Autor. Berühmtestes Beispiel dafür ist die Wikipedia.
  • Forschung wird gefördert, wenn wissenschaftliche Erkenntnisse für alle Forscher frei zugänglich sind. Forschungsdaten nicht zugänglich zu machen widerspricht Guter wissenschaftlicher Praxis und schränkt die Reproduzierbarkeit, Weiterentwicklung und Transfer ein.
  • In den Behörden wird Geld gespart, weil z. B. weniger bzw. keine Anfragen mehr an die Behörden gestellt werden.[21]
  • Unternehmen können einfacher und besser Geld erwirtschaften, weil die für bestimmte Projekte nötigen Daten besser bzw. überhaupt verfügbar sind.[22]
  • Die Bürger können sich besser über ihre Umgebung informieren sowie Zusammenhänge, Vorhaben und Zahlen und Fakten besser verstehen.[23]

Argumente gegen Open Data

  • Moralischer Anspruch auf das Urheberrecht
  • Der Urheber möchte finanziellen Gewinn erzielen
  • Innovationsschutz durch Marken- und Patentrecht. Der Urheber möchte seine neuen Ideen schützen.
  • Durch Open Data treten durch Steuergelder geförderte Informationssammlungen in Konkurrenz zu kommerziellen Angeboten (Wettbewerbsrecht, siehe auch Streit zur Tagesschau-App)
  • Durch die einfache Zugänglichkeit von Daten und eventuell sogar dem Recht, Änderungen daran vorzunehmen, besteht die Gefahr, dass die Daten absichtlich oder unabsichtlich verfälscht werden.
  • Durch das Offenlegen von Daten wird deren Missbrauch erleichtert. Beispiele sind Listen von Sicherheitslücken in IT-Systemen, Daten aus der Waffenforschung, oder Publikationen zu genmanipulierten hochansteckenden Vogelgrippeviren.[24]
  • Datenschutzrechtliche Bedenken, z. B. wenn das Verhalten von Individuen aufgezeichnet wird, und die Datensätze nicht ausreichend anonymisiert wurden
  • Haftung: Je nachdem, ob die offenen Datensätze dem Kunden kostenlos oder kommerziell zugänglich gemacht werden, unterscheidet sich die Haftung wenn diese Datensätze genutzt werden, und es zu einem Schadensfall kommt. Die rechtliche Lage zur Haftung kann je nach Einzelfall stark variieren.[25]

Projekte, die Open Data anbieten

Projekt Inhalt Lizenz
Wikipedia Wissen CC BY-SA
Wikidata Daten CC0
OpenStreetMap Geo-Daten ODbL
PANGAEA Erdsystem CC BY
Datahub.io[26] Daten abhängig von jeweiligen Datensätzen
Berlin[27] Daten abhängig von jeweiligen Datensätzen
Düsseldorf[28] Daten Datensätze (soweit nicht anders gekennzeichnet): DL-DE->Zero-2.0, Redaktionelle Inhalte: CC-BY 4.0
Hamburg[29] Daten abhängig von jeweiligen Datensätzen
Leipzig[30] Daten abhängig von jeweiligen Datensätzen
Wuppertal[31] Daten abhängig von jeweiligen Datensätzen
Deutsche Bahn[32] Daten abhängig von jeweiligen Datensätzen
GDELT Project Daten
opendata.swiss OGD div. proprietäre Lizenzen
data.gv.at OGD CC-BY 4.0
e!DAL PGP Pflanzengenom und -phänom Creative Commons kompatible Lizenzen
Open Food Facts Nahrungsmittelproduktdatenbank ODbL
VGN Soll Fahrpläne Daten (Fahrpläne) CC BY 3.0 DE
Open Data Portal Bayern Daten
Baustelleninformationssystem des Bundes und der Länder Daten
Deutscher Wetterdienst Daten
Open-Data-Portal Stadt München Daten
CERN Daten
NASA Daten
Open-Data-Portal Stadt Freiburg Daten

Open-Data-Hackathons

Der Hackathon „Coding da Vinci“ wird seit 2014 jährlich in Deutschland ausgerichtet und fordert Entwickler auf, Anwendungen zu erarbeiten, die Daten aus Kultureinrichtungen nutzbar machen. Im Gegensatz zu klassischen Hackathons haben die Teilnehmer des „Coding da Vinci“ sechs bis zehn Wochen Zeit für die Entwicklung der Softwareanwendung.[33] 2015 veranstaltete die Stadt Freiburg im Breisgau einen Open-Data-Hackathon zur besseren Nutzung der Open Data der Stadt.[34] Die Deutsche Bahn veranstaltete 2015 eine „DB Open Data-Train Challenge“ zur Entwicklung einer neuartigen Fahrplananzeige.[35]

Closed Data

Es existieren verschiedene Mechanismen, um den freien Zugang zu Daten und deren freie Weiterverwendung zu erschweren:

  • Lagerung der Daten in nicht-digitalisierter (d. h. Papier-) Form
  • Verwendung von proprietären Technologien (z. B. nicht-offene Dateiformate)
  • Urheberrecht
  • Patente
  • Lizenzvereinbarungen
  • Zeitlich begrenzter oder kostenpflichtiger Zugang zu den Daten
  • Kommerzielle Anbieter, die versuchen, mit Lobbyarbeit Einfluss auf die Politik zu erlangen, und Open Data einzuschränken. Dies geschah z. B. bei PubChem, einer US-amerikanischen Datenbank zu chemischen Verbindungen.[36]

Siehe auch

Literatur

  • Thilo Hagendorff: Open Data. In: Jessica Heesen (Hrsg.): Handbuch Informations- und Medienethik. Metzler, Stuttgart 2016, S. 227–233.

Weblinks

Deutschsprachig

Englischsprachig

Einzelnachweise

  1. a b c Jörn von Lucke, Christian Geiger: Open Government Data (Frei verfügbare Daten des öffentlichen Sektors). Hrsg.: zeppelin university. Friedrichshafen 3. Dezember 2010 (zu.de [PDF]).
  2. a b The Open Definition. Open Knowledge Foundation, abgerufen am 18. Februar 2017 (englisch).
  3. Peter Brettschneider, Alexandra Axtmann, Elisabeth Böker, Dirk Von Suchodoletz: Offene Lizenzen für Forschungsdaten. In: o-bib. Das offene Bibliotheksjournal / Herausgeber VDB. 28. September 2021, S. 1–22 Seiten, doi:10.5282/O-BIB/5749 (o-bib.de [abgerufen am 6. Oktober 2021]).
  4. Danny Lämmerhirt: Avoiding data use silos: How governments can simplify the open licensing landscape. Open Knowledge International, abgerufen am 6. Oktober 2021 (englisch).
  5. Marcus M. Dapp, Dian Balta, Walter Palmetshofer, Helmut Krcmar, Pencho Kuzev: Open Data the benefits. Das volkswirtschaftliche Potential für Deutschland. Hrsg.: Konrad-Adenauer-Stiftung. Konrad-Adenauer-Stiftung e.V., Berlin 2016, ISBN 978-3-95721-202-3.
  6. Jörn von Lucke: Innovationsschub durch Open Data, Datenportale und Umsetzungswettbewerbe. In: Reinbert Schauer, Norbert Thom, Dennis Hilgers (Hrsg.): Innovative Verwaltung. Innovationsmanagement als Instrument von Verwaltungsreformen. Trauner, Johannes Kepler Universität Linz 2011, ISBN 978-3-85499-850-1, S. 261–272.
  7. Was ist Open Data? Konrad Adenauer Stiftung, abgerufen am 18. Februar 2017.
  8. Keith G Jeffery: Open Data – The Time has Come. Blogkommentar. In: petermr's blog. 3. Oktober 2006, abgerufen am 18. Februar 2017 (englisch): „Although the term open data is rather new, the concept is rather old. The International Geophysical Year of 1957-8 caused the setting up of several world data centres and - more importantly - set standards for descriptive metadata to be used for data exchange and utilisation.“
  9. a b c Harlan Yu, David G. Robinson: The New Ambiguity of ‘Open Government’. ID 2012489. Social Science Research Network, Rochester, NY 28. Februar 2012, doi:10.2139/ssrn.2012489.
  10. National Research Council: On the Full and Open Exchange of Scientific Data. 1995, doi:10.17226/18769.
  11. AB 1624 (Bowen). 18. Mai 1993, abgerufen am 18. Februar 2017 (englisch).
  12. a b Bundesregierung: Open-Data-Strategie der Bundesregierung. S. 15, abgerufen am 5. August 2021.
  13. Stefan Krempl: Bundestag beschließt halbgares Open-Data-Gesetz. In: heise online. Abgerufen am 6. April 2019.
  14. BMWi: Zweites Open-Data-Gesetz und Datennutzungsgesetz. Abgerufen am 5. August 2021.
  15. Gesetz für die Nutzung von Daten des öffentlichen Sektors (Datennutzungsgesetz - DNG)
  16. Sozialdemokratische Partei Deutschlands, Bündnis 90/ die Grünen, Freie Demokratische Partei: Mehr Fortschritt wagen. Bündnis für Freiheit, Gerechtigkeit und Nachhaltigkeit.KOALITIONSVERTRAG 2021— 2025 ZWISCHEN DER SOZIALDEMOKRATISCHEN PARTEI DEUTSCHLANDS (SPD), BÜNDNIS 90 / DIE GRÜNEN UND DEN FREIEN DEMOKRATEN (FDP). In: Sozialdemokratische Partei Deutschlands. 2021, abgerufen am 31. August 2022.
  17. Science Commons
  18. Denny Vrandečić: Free data - Simia. Abgerufen am 6. Oktober 2021 (englisch).
  19. theyworkforyou.com
  20. Tina Klopp: Mit alten Daten neues Wissen schaffen. Zeit online, 16. April 2010.
  21. Folie 13. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.
  22. Folie 16. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.
  23. Folie 17. Open Data der Stadt Zürich. Was bringt es? 27. November 2014; abgerufen am 4. Februar 2015.
  24. Vogelgrippe-Forscher stoppen Arbeit am Supervirus. zeit.de, 21. Januar 2012; abgerufen am 3. März 2012.
  25. Open Source – Wer haftet, wenn es schief geht. manager-magazin.de, 11. Oktober 2004; abgerufen am 3. März 2012.
  26. datahub.io
  27. daten.berlin.de
  28. opendata.duesseldorf.de
  29. transparenz.hamburg.de
  30. Willkommen - Open Data-Portal der Stadt Leipzig. Abgerufen am 21. März 2022.
  31. Offene Daten Wuppertal
  32. data.deutschebahn.com
  33. Was ist Coding da Vinci? Wikimedia Deutschland e. V., archiviert vom Original; abgerufen am 24. März 2020.
  34. Violetta Kuhn: Erster Open-Data-Hackathon in Freiburg: Apps für die Lebensqualität. In: Badische-Zeitung.de. 9. März 2015, abgerufen am 18. März 2015.
  35. DB Open Data-Train Challenge. In: eventbrite.com. Archiviert vom Original; abgerufen am 18. März 2015.
  36. ACS Challenging NIH’s PubChem Database. arl.org; abgerufen am 3. März 2012