Forschungsdatenzentrum

aus Wikipedia, der freien Enzyklopädie

Ein Forschungsdatenzentrum (Abk. FDZ) archiviert Daten und macht diese über verschiedene Zugangswege unter Einhaltung des Datenschutzes für wissenschaftliche Zwecke zugänglich.[1] Es ist Teil der Forschungsdateninfrastruktur.

Datenzentren werden von vielen Disziplinen als ideale Lösung angesehen, um Zugang zu Forschungsdaten zu gewährleisten[2]. Die Qualitätssicherung bei der Akkreditierung von Forschungsdatenzentren gewährleistet einen Mindeststandard und begleitet die Arbeit der Forschungsdatenzentren fortwährend durch ein Monitoring. Sie stellt eine „freiwillige, wissenschaftsintern organisierte Zertifizierung“ dar[2]. 2020 gab es in Deutschland 39 akkreditierte Forschungsdatenzentren[3]. Diese sind sowohl an staatlichen Stellen als auch bei wissenschaftlichen Institutionen angesiedelt. Forschungsdatenzentren werden von ihren jeweiligen Trägereinrichtungen getragen.

Auch das Kraftfahrt-Bundesamt unterhält ein Forschungsdatenzentrum

Qualitätssicherung

Um die Verlässlichkeit von Forschungsdatenzentren als Teil der Forschungsinfrastruktur sicherzustellen, hat der Rat für Sozial- und Wirtschaftsdaten (RatSWD) ein Akkreditierungssystem entwickelt. Damit soll sichergestellt werden, dass Datenproduzierende, die ihre Daten bisher gar nicht oder nur wenigen privilegierten Partnern in der Wissenschaft zur Verfügung stellen, in Zukunft allen wissenschaftlich Forschenden in gleicher Weise einen Datenzugang zu gewähren. Die Forschungsdatenzentren nehmen dabei die Rolle eines Datentreuhänders ein. Das Verfahren hat den Anspruch, den Bedürfnissen der Wissenschaft und des Datenschutzes gleichermaßen gerecht zu werden[4]. Wichtige Voraussetzung für eine Akkreditierung ist die nachweisliche Existenz eines operativen Geschäfts des Forschungsdatenzentrums. Darüber hinaus müssen mindestens drei Kriterien erfüllt sein:

  • mindestens ein Datenzugangsweg
  • Bereitstellung ausreichender Dokumentationen zu den Daten
  • Konzept zur langfristigen Verfügbarmachung der Daten

Für das Monitoring beteiligen sich alle akkreditierten Forschungsdatenzentren über die Beantwortung eines Fragebogens an einem jährlichen Berichtswesen. Dieses basiert auf denselben Kriterien wie die Akkreditierung.[4] Darüber hinaus ist im Zuge der Qualitätssicherung auch ein Beschwerdemanagement etabliert. Bei Bedarf wird durch den RatSWD eine Evaluationskommission eingesetzt. Als Beispiel wird das Vorliegen eines ernsthaften Mangels im Datenangebot eines FDZ genannt.[4]

Entwicklung

Im März 2001 legte die zwei Jahre zuvor gegründete „Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik“ (KVI) ein umfassendes Gutachten vor. Sie konstatierte dabei „ein außerordentlich umfangreiches und vielfältiges Informationsangebot. Es ist aber einerseits so unübersichtlich, dass sogar ausgewiesene Expertinnen und Experten Schwierigkeiten haben, in ihren eigenen Bereichen den Überblick zu behalten“[5]. Eine der zentralen Empfehlungen war die Einrichtung von Forschungsdatenzentren bei den Statistischen Ämtern des Bundes und der Länder, der Deutschen Rentenversicherung Bund und der Bundesagentur für Arbeit. Die Wurzeln der Forschungsdatenzentren gehen allerdings weiter zurück: Bereits 1987 war auf Empfehlung des Wissenschaftsrates ein erstes Servicezentrum für amtliche Mikrodaten eingerichtet worden.[6] Die Empfehlung der KVI führt aus: „Forschungsdatenzentren bieten im Grundsatz Daten unterschiedlicher Datenbesitzer und Datenproduzenten an. Insbesondere sind sie auch nicht ausschließlich auf Daten der amtlichen Statistik begrenzt. Sie sollten auch besonders zu schützende und nicht hinreichend anonymisierbare Daten aus der wissenschaftlichen Forschung zugänglich machen.“[5] Mit der Gründung des RatSWD und der Schaffung des Akkreditierungssystems wuchs die Zahl der FDZ beständig.

<timeline>

Define $value1 = 6 Define $value2 = 6 Define $value3 = 6 Define $value4 = 6 Define $value5 = 6 Define $value6 = 6 Define $value7 = 6 Define $value8 = 8 Define $value9 = 13 Define $value10 = 18 Define $value11 = 21 Define $value12 = 25 Define $value13 = 27 Define $value14 = 29 Define $value15 = 31 Define $value16 = 31 Define $value17 = 31 Define $value18 = 32 Define $value19 = 34 Define $value20 = 39 Define $value21 = 40 Define $value22 = 41 Define $value23 = 0 Define $value24 = 0 Define $value25 = 0 Define $value26 = 0 Define $value27 = 0 Define $value28 = 0 Define $value29 = 0 Define $value30 = 0

Define $averagevalue = 0 Colors =

 id:grid value:gray(0.9)
 id:values value:rgb(0,0,0)

ImageSize = width:500 height:180 PlotArea = width:425 height:100 left:60 bottom:25 Period = from:0 till:45 TimeAxis = orientation:vertical AlignBars = justify ScaleMajor = increment:5 start:0 ScaleMinor = gridcolor:grid increment:5 start:0

BarData =

 bar:space
 bar:2001 text:2001
 bar:space
 bar:02 text:02
 bar:space
 bar:03 text:03
 bar:space
 bar:04 text:04
 bar:space
 bar:05 text:05
 bar:space
 bar:06 text:06
 bar:space
 bar:07 text:07
 bar:space
 bar:08 text:08
 bar:space
 bar:09 text:09
 bar:space
 bar:10 text:10
 bar:space
 bar:11 text:11
 bar:space
 bar:12 text:12
 bar:space
 bar:13 text:13
 bar:space
 bar:14 text:14
 bar:space
 bar:15 text:15
 bar:space
 bar:16 text:16
 bar:space
 bar:17 text:17
 bar:space
 bar:18 text:18
 bar:space
 bar:19 text:19
 bar:space
 bar:20 text:20
 bar:space
 bar:21 text:21
 bar:space
 bar:2022 text:2022
 bar:space
 

PlotData =

 color:values width:10 align:center
 bar:2001 from:start till:$value1
 bar:02 from:start till:$value2
 bar:03 from:start till:$value3
 bar:04 from:start till:$value4
 bar:05 from:start till:$value5
 bar:06 from:start till:$value6
 bar:07 from:start till:$value7
 bar:08 from:start till:$value8
 bar:09 from:start till:$value9
 bar:10 from:start till:$value10
 bar:11 from:start till:$value11
 bar:12 from:start till:$value12
 bar:13 from:start till:$value13
 bar:14 from:start till:$value14
 bar:15 from:start till:$value15
 bar:16 from:start till:$value16
 bar:17 from:start till:$value17
 bar:18 from:start till:$value18
 bar:19 from:start till:$value19
 bar:20 from:start till:$value20
 bar:21 from:start till:$value21
 bar:2022 from:start till:$value22
 

TextData =

 pos:(0,192) fontsize:L
 tabs:(250-center)
 text:^"Akkreditierte Forschungsdatenzentren (FDZ)"
 pos:(0,175) fontsize:M
 tabs:(250-center)
 text:^"2001–2022"
</timeline>
Quelle: RatSWD[3][7]

Eine Übersicht über die FDZ gibt ein jährlicher Tätigkeitsbericht des RatSWD[1] [3]. Die ersten sechs Forschungsdatenzentren waren die FDZ der Statistischen Ämter des Bundes und der Länder, das German Microdata Lab bei GESIS – Leibniz-Institut für Sozialwissenschaften, das International Data Service Center am Forschungsinstitut zur Zukunft der Arbeit, das FDZ der Bundesagentur für Arbeit sowie jenes der Deutschen Rentenversicherung Bund.

Zugangs- und Bereitstellungsformen

Hauptgrund für die Einrichtung der Forschungsdatenzentren ist, dass sie für wissenschaftliche Zwecke den Zugang zu sensiblen Daten ermöglichen. Solche Daten können nicht als Open Data bereitgestellt werden, sondern unterliegen Beschränkungen rechtlicher (Urheberrecht, Datenschutz …) oder ethischer Natur. Damit ergibt sich oft die Notwendigkeit der Anonymisierung und Pseudonymisierung. Entsprechend ergeben sich verschiedene Zugangs- bzw. Bereitstellungsformen für die Daten: Public-Use-File, Scientific-Use-File, Datenfernverarbeitung, Remote Access, Gastwissenschaftlerarbeitsplatz.

Je nach Forschungsfrage können im Einzelfall unterschiedliche Zugangsformen zu denselben Daten nötig sein. So steht beispielsweise ein Scientific-Use-File des ALLBUS allen Wissenschaftlern zum Download zur Verfügung. Möchte man die Befragungsdaten aber beispielsweise regional mit Kontextinformationen zusammen analysieren (z. B. Einstellungen zu Migration mit Anzahl der Migranten in einer Region), so ist der Zugang über einen Gastwissenschaftlerarbeitsplatz nötig, da hierzu sensible Daten zum Region des Wohnortes der Befragten nötig sind.

Nutzung

Die Nutzung der Forschungsdaten aus den Forschungsdatenzentren wird in einem jährlichen Tätigkeitsbericht dokumentiert.[3] Für 2020 wurden demnach von 39 Forschungsdatenzentren 4.917 Datensätze bereitgestellt, die von 43.703 externen Datennutzenden nachgefragt worden waren. Es resultierten 2.906 Publikationen, die auf den angebotenen Datensätzen basieren.[3] Darüber hinaus werden auf Grundlage der Daten aus den Forschungsdatenzentren auch politische Entscheidungen informiert.[8]

International

Ähnliche Strukturen wie die Forschungsdatenzentren existieren auch in anderen Ländern, z. B. die Federal Statistical Research Data Centers. Sie gewähren Zugang zu den Mikrodaten der U.S. Bundesregierung und bestehen an 30 Standorten. Ebenso unterhalten die Centers for Disease Control and Prevention ein Forschungsdatenzentrum, das „für die Wahrung der Privatsphäre von Befragten, Studienteilnehmern oder Institutionen verantwortlich ist und gleichzeitig Zugang zu den Daten mit eingeschränkter Nutzungsmöglichkeit für statistische Zwecke gewährt.“[9]

Das FDZ des Robert-Koch-Institutes stellt ebenfalls viele Daten für die Forschung bereit.

Das Canadian Research Data Centre Network (CRDCN) basiert auf einer Partnerschaft zwischen kanadischen Universitäten mit Statistics Canada und stellt vertrauliche Mikrodaten aus den Bereichen Soziales, Wirtschaft und Gesundheit in sicheren Computereinrichtungen an Universitätsstandorten im ganzen Land zur Verfügung.[10]

Im Vergleich europäischer Ländern habe sich Deutschland durch den Aufbau der Forschungsdatenzentren von einem „Schlusslicht“ zu einem „innovativen Ideengeber“ entwickelt.[8]

Weitere Entwicklungen

Bereits von der KVI war empfohlen worden, in den Forschungsdatenzentren verstärkt Fernzugriffe zu ermöglichen.[5] Dies ist, ebenso wie die Unterstützung der rechtlich eigenständigen Forschungsdatenzentren bei der Harmonisierung ihrer Prozesse (z. B. Verträge für den Datenzugang) seit Herbst 2020 Schwerpunkte der Arbeit von KonsortSWD im Rahmen der Nationalen Forschungsdateninfrastruktur (NFDI).[11] Darüber hinaus soll, wie der Wissenschaftsrat bereits 2012 empfohlen hat, "das Netzwerk der der Forschungsdatenzentren weiter ausgebaut werden, "zur Verbesserung der Speichermöglichkeiten und des Zugangs zu Forschungsdaten […] das Netz der Forschungsdaten- und Datenservicezentren ausgebaut werden" [12]. In ihrer Datenstrategie kündigt die Bundesregierung den Aufbau von Forschungsdatentrenten für den „Datenraum Gesundheit“ sowie den Ausbau des FDZ der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin an.[13] Diesen Impuls aufgreifend wurde eine Übersicht über Best Practices erstellt. Diese weist u. a. darauf hin, dass für ein FDZ ausreichend und qualifiziertes Personal benötigt wird, das an der Schnittstelle zwischen Fachwissenschaft und Informationsinfrastrukturen arbeitet.[14] Im Bereich der Bildungsdaten (z. B. Schulqualitätsforschung) werden die Angebote verschiedener FDZ, darunter das Forschungsdatenzentrum Bildung, im Verbund Forschungsdaten Bildung gebündelt. KonsortSWD baut im Rahmen der Nationalen Forschungsdateninfrastruktur mit QualidataNet einen ähnlich angelegten Verbund für qualitative Forschungsdaten (z. B. Interviews) auf[15].

Weblinks

Einzelnachweise

  1. a b Rat für Sozial- und Wirtschaftsdaten (RatSWD): Tätigkeitsbericht 2019 der vom RatSWD akkreditierten Forschungsdatenzentren (FDZ). Berlin 2020, doi:10.17620/02671.56 (konsortswd.de [PDF]).
  2. a b Rat für Informationsinfrastrukturen: Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland. Göttingen 3. Mai 2016 (rfii.de).
  3. a b c d e Rat für Sozial- und Wirtschaftsdaten (RatSWD): Tätigkeitsbericht 2020 der vom RatSWD akkreditierten Forschungsdatenzentren (FDZ). Berlin 2022, doi:10.17620/02671.65 (konsortswd.de [PDF]).
  4. a b c Rat für Sozial- und Wirtschaftsdaten (RatSWD): Handreichung zu den Richtlinien zur Akkreditierung von Forschungsdatenzentren, zum Monitoring- und Evaluationsprozess und zum Beschwerdeverfahren. Berlin 2017, doi:10.17620/02671.4.
  5. a b c Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik: Wege zu einer besseren informationellen Infrastruktur. Nomos Verlagsgesellschaft, Baden-Baden 2001, ISBN 3-7890-7388-1 (ratswd.de [PDF]).
  6. Hilmar Schneider, Christof Wolf: Die Datenservicezentren als Teil der informationellen Infrastruktur. In: Gabriele Rolf, Markus Zwick, Gert G. Wagner (Hrsg.): Fortschritte bei der informationellen Infrastruktur in Deutschland. Festschrift für Johann Hahlen zum 65. Geburtstag und Hans-Jürgen Krupp zum 75. Geburtstag. Nomos Verlagsgesellschaft, Baden-Baden 2008, ISBN 978-3-8329-3540-5, S. 236–249.
  7. Alle Datenzentren. Abgerufen am 30. August 2022.
  8. a b Stefan Bender, Ralf Himmelreicher, Sylvia Zühlke, Markus Zwick: ForschungsDatenZentren – Eine informationelle Infrastruktur mit erFreulichem Daten Zugang. In: Gabriele Rolf, Markus Zwick, Gert G. Wagner (Hrsg.): Fortschritte bei der informationellen Infrastruktur in Deutschland. Festschrift für Johann Hahlen zum 65. Geburtstag und Hans-Jürgen Krupp zum 75. Geburtstag. Nomos Verlagsgesellschaft, Baden-Baden 2008, ISBN 978-3-8329-3540-5, S. 147–158.
  9. CDC - National Center for Health Statistics: About the CRDCN. 2020, abgerufen am 10. Dezember 2020.
  10. Canadian Research Data Centre Network: Research Data Center (RDC). 2020, abgerufen am 9. Dezember 2020.
  11. KonsortSWD, auf forschungsdaten.info, abgerufen am 10. Januar 2021
  12. Wissenschaftsrat: Empfehlungen zur Weiterentwicklung der wissenschaftlichen Informationsinfrastrukturen in Deutschland bis 2020. Berlin 13. Juli 2012 (wissenschaftsrat.de [PDF]).
  13. Bundesregierung: Datenstrategie der Bundesregierung: Eine Innovationsstrategie für gesellschaftlichen Fortschritt und nachhaltiges Wachstum. Berlin 2021 (bundesregierung.de [PDF]).
  14. Daniel Buck, Johannes Croisier, Christina Eder, Ute Hoffstätter, Malte Jansen, Alexia Meyermann, Pascal Siegers: Handreichung: Forschungsdatenzentren gründen. (= RatSWD Working Paper Series). Berlin 2022, doi:10.17620/02671.70.
  15. KonsortSWD: QualidataNet – Data Sharing und Sekundärnutzung für qualitative Forschungsdaten. 2022, abgerufen am 30. August 2022.