Data Science

aus Wikipedia, der freien Enzyklopädie

Data Science (von englisch data „Daten“ und science „Wissenschaft“, im Deutschen auch Datenwissenschaft) bezeichnet generell die Extraktion von Wissen aus Daten, um daraus zu lernen.[1][2][3]

Data Science ist ein interdisziplinäres Wissenschaftsfeld, welches wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch unstrukturierten Daten ermöglicht.[4][5]

In dem Buch „Neue Dimensionen in Data Science“ (09/2022) stellt Herter heraus, dass der Begriff deutlich weiter gefasst werden muss, weil die bisher hier aufgeführten Online-Referenzen weder die wissenschaftliche Bedeutung der Datenerfassung unserer Welt (nach Raum und Zeit), noch den evolutionären Gedanken menschlicher Handlungsoptimierung betonen und definiert Data Science deshalb als ein interdisziplinäres Wissenschaftsfeld, das sich mit der exakten digitalen Erfassung, Analyse und Visualisierung vergangener, aktueller sowie zukünftiger Phänomene unserer realen Welt beschäftigt, um datengetrieben den Prozess der Wissensgenerierung als bestmögliche Entscheidungsbasis für menschliches Handeln zu optimieren.[6]

Der Studiengang Data Science verwendet Techniken und Theorien aus den Fächern Mathematik, Statistik und Informationstechnologie, einschließlich der Signalverarbeitung, verwendet Wahrscheinlichkeitsmodelle des maschinellen Lernens, des statistischen Lernens, der Programmierung, der Datentechnik, der Mustererkennung, der Prognostik, der Modellierung von Unsicherheiten und der Datenlagerung.

Personen, die im Bereich Data Science arbeiten, werden als Data Scientist bzw. Datenwissenschaftler bezeichnet, wobei meist speziellere oder Spezialisierungen anderer, übergeordneter Berufsbezeichnungen üblich sind (z. B. Statistiker, Informatiker).

Geschichte

Der Begriff „Data Science“ existiert seit über 40 Jahren und wurde ursprünglich als Ersatz für den Begriff „Informatik“ von Peter Naur im Jahr 1960 verwendet. 1974 veröffentlichte Naur in der Concise Survey of Computer Methods eine Umfrage über die zeitgenössische Datenverarbeitung, in welcher der Begriff „Data Science“ frei verwendet wurde.

1996 trafen sich die Mitglieder der International Federation of Classification Societies (IFCS) in Kobe für ihre zweijährliche Konferenz. Bei dieser Konferenz war zum ersten Mal der Begriff „Data Science“ im Titel der Konferenz enthalten.[7]

Die moderne Definition von Data Science wurde erstmals im Rahmen des zweiten japanisch-französischen Statistiksymposiums an der Universität Montpellier II (Frankreich) im Jahr 1992 entworfen.[8] Die Teilnehmer würdigten die Entstehung einer neuen Disziplin mit einem besonderen Fokus auf Daten aus verschiedenen Herkünften, Dimensionen, Typen und Strukturen. Sie prägten die Kontur dieser neuen Wissenschaft, die auf etablierten Konzepten und Prinzipien der Statistik und Datenanalyse basiert, unter weitgehender Nutzung der zunehmenden Macht der Computerwerkzeuge.

Im November 1997 gab C. F. Jeff Wu den Eröffnungsvortrag mit dem Titel „Statistik = Datenwissenschaft?“[9] für seine Ernennung zum H. C. Carver Professor of Statistics an der University of Michigan.[10] In diesem Vortrag charakterisierte er die statistische Arbeit als eine Trilogie von Datenerfassung, Datenmodellierung und -analyse und die Entscheidungsfindung. Abschließend rief er den Begriff „Datenwissenschaft“ ins Leben und befürwortete, dass die Statistik in „Datenwissenschaft“ und Statistiker in „Datenwissenschaftler“ umbenannt werden.[9] Später präsentierte er einen Vortrag mit dem Titel „Statistik = Datenwissenschaft?“, als ersten von seinen Mahalanobis-Memorial-Vorträgen.[11] Diese Vorträge ehren Prasanta Chandra Mahalanobis, einen indischen Wissenschaftler, Statistiker und Gründer des „Indian Statistical Instituts“.

2001 führte William S. Cleveland die Datenwissenschaft als eigenständige Disziplin in seinem Artikel „Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics“ ein. In seinem Bericht stellte Cleveland sechs für ihn umfassende Gebiete der Datenwissenschaft vor: multidisziplinäre Untersuchungen, Modelle und Methoden für Daten, Rechnen mit Daten, Pädagogik, Werkzeug-Bewertung und Theorie.

Im April 2002 veröffentlichte der internationale Rat für Wissenschaft: Ausschuss für die Daten für Wissenschaft und Theorie, das Data Science Journal,[12] welche sich auf die Problematik, wie die Beschreibung von Datensystemen, ihre Veröffentlichung im Internet, Anwendungen und gesetzlichen Problemen konzentrierte.[13]

Kurz darauf begann die Columbia University 2003 die Zeitschrift „The Journal of Data Science“[14] zu veröffentlichen, welche eine Plattform für alle Datenanbieter zur Verfügung stellte um ihre Ansichten und Ideen zum Austausch zu präsentieren. Die Zeitschrift wurde größtenteils der Anwendung von statistischen Methoden und der quantitativen Forschung gewidmet.

2005 veröffentlichte das National Science Board den Bericht „Long-lived Digital Data Collections: Enabling Research and Education in the 21st Century“, in welchem unter dem Begriff Data Scientists verschiedene Experten aufgeführt werden, die von entscheidender Bedeutung für das erfolgreiche Management digitalen Daten sind. Genannt werden unter anderem Informatiker, Datenbankexperten, Programmierer, Domänenexperten, Bibliothekare, Archivare sowie Experten im Bereich Software Engineering. Als Teil der Verantwortlichkeiten von Data Scientists wird insbesondere die Entwicklung innovativer Konzepte in den Bereichen Datenbanktechnologie und Informationswissenschaft betont. Hierunter fallen auch Methoden der Informationsvisualisierung, Datenanalyse und Wissensentdeckung in Datenbanken.[15]

Das Berufsfeld

Weltweit besteht ein Mangel an Experten in dem Bereich der Datenanalyse.[16][17]

Anforderungen

Ein Data Scientist sollte überzeugend und kreativ sein, aber auch ein gewisses Kommunikationstalent mitbringen, um sich mit verschiedenen Ebenen einer Organisation austauschen zu können. Er ist das Bindeglied und der Vermittler zwischen allen Ebenen eines Unternehmens und nimmt somit die Rolle des „Übersetzers“ ein, indem er die Ergebnisse für die einzelnen Fachabteilungen genauso verständlich aufbereitet wie für das Top Management. Zudem sollte ein Data Scientist aufgeschlossen genug sein, um neue Analysetools und innovative Analyseverfahren zu erforschen und zu nutzen. Unvoreingenommen sollte ein Data Scientist nach anderen Ansätzen suchen wollen und immer neue Fragen stellen. Zusätzlich setzt dieser Beruf ein gewisses Koordinationstalent voraus, nicht zuletzt weil bestimmte Aufgaben, wie zum Beispiel die Beschaffung der Daten, an andere Mitarbeiter delegiert werden können. Kontrolle und Steuerung sollten jedoch immer in der Hand des Data Scientisten bleiben.[18]

Aufgabenbereich

Der Job eines Data Scientist ist es, aus großen Datenmengen Informationen zu generieren und Handlungsempfehlungen abzuleiten, die das Unternehmen befähigen, effizienter zu arbeiten. Dazu bedient er sich innovativer Analysetools und entwickelt Abfragen, die aus unübersichtlichen Datenmengen wertvolle Informationen destillieren. Anschließend werden Hypothesen abgeleitet, welche statistisch überprüft und für das Management als Entscheidungsgrundlage aufbereitet werden.

Ausbildungsmöglichkeiten

Im deutschen Sprachraum bieten verschiedene Hochschulen auf Data Science spezialisierte Studiengänge an. Der Schwerpunkt liegt dabei auf Masterstudiengängen, inzwischen werden aber auch Bachelorstudiengänge angeboten. Darüber hinaus gibt es spezialisierte Weiterbildungsangebote sowie berufsbegleitende Studiengänge.

Bachelorstudiengänge: Die Technische Universität Dortmund bietet seit dem Wintersemester 2002/2003 den Bachelorstudiengang Datenanalyse und Datenmanagement an.[19] Die Philipps-Universität Marburg und die Universität Stuttgart bieten ab dem Wintersemester 2016/2017 die deutschlandweit ersten Bachelorstudiengänge mit dem Namen Data Science an.[20][21] Die Technische Hochschule OWL in Lemgo bietet den Bachelorstudiengang Data Science an, der auch als Duales Studium absolviert werden kann.[22] Die University of Applied Sciences Europe -BiTS und BTK bietet den Bachelor-Studiengang Digital Business & Data Science an.[23] Die Georg-August-Universität Göttingen bietet ab dem Wintersemester 2018/2019 die Bachelorstudiengänge Angewandte Data Science und Mathematical Data Science an.[24][25] An der Westsächsischen Hochschule Zwickau wird ab dem Wintersemester 2018/2019 erstmals in den neuen Bundesländern ein Bachelorstudiengang Data Science angeboten. Die ebenfalls in Sachsen gelegene Hochschule Mittweida hat zeitgleich eine gleichnamige Vertiefungsrichtung in ihrem Bachelorstudiengang Wirtschaftsingenieurwesen eingeführt.[26] An der Hochschule Stralsund ist Data Science seit 2015 ein wesentlicher Bestandteil der Lehre im Studiengang Wirtschaftsinformatik.[27] Die Hochschule Hannover bietet ab Wintersemester 2021/22 den Studiengang Angewandte Mathematik und Data Science an.[28] Verschiedene Universitäten im nicht deutschsprachigen Raum bieten auch online Data Science Courses an.[29]

Masterstudiengänge: Die Philipps-Universität Marburg bietet neben dem Bachelorstudiengang auch einen Masterstudiengang Data Science an.[21] Ebenso bietet die Georg-August-Universität Göttingen neben ihren Bachelorstudiengängen einen Masterstudiengang Angewandte Data Science an.[30] An der Hochschule für Technik und Wirtschaft Berlin wird ab dem Wintersemester 2016/17 ein Studiengang angeboten, der sich gemeinsam mit dem Projekt Management diesem Schwerpunkt widmet.[31] Die Hochschule Darmstadt bietet ab dem Wintersemester 2016/2017 einen Masterstudiengang Data Science an, der gemeinsam von den Fachbereichen Informatik sowie Mathematik und Naturwissenschaften betrieben wird.[32] An der Ludwig-Maximilians-Universität München wird ein Masterstudiengang Data Science angeboten,[33] der vom Elitenetzwerk Bayern gefördert wird.[34] An der Leuphana Universität Lüneburg wird der Masterstudiengang Management & Data Science angeboten.[35] Die Universität Linz bietet ein Wirtschaftsinformatikstudium mit Schwerpunkt auf Business Intelligence & Data Science an.[36] An der Technischen Universität Dortmund wurde seit dem Wintersemester 2002/2003 das Masterstudium Datenwissenschaft angeboten,[37] und mit Auslaufen dieses Studienganges ein Masterstudium Data Science eingerichtet. An der Otto-von-Guericke-Universität Magdeburg gibt es das Masterstudium Data and Knowledge Engineering.[38] An der Friedrich-Schiller-Universität Jena wird das Masterstudium Computational and Data Science gelehrt.[39] An der Berliner Hochschule für Technik (ehemalige Beuth Hochschule für Technik Berlin) gibt es den englischsprachigen Master in Data Science mit dem Ausbildungsziel Data Science bzw. Data Engineering.[40] Die Paris Lodron Universität Salzburg bietet als erste österreichische Universität ab Wintersemester 2016 das viersemestrige Masterstudium Data Science an.[41][42] 2016 präsentierte die Universität Mannheim den Studiengang Data Science als ihren neuesten Zuwachs. Seit dem Wintersemester 2017/2018 wird an der Hochschule für Technik, Wirtschaft und Medien Offenburg im Masterstudiengang Informatik der Schwerpunkt Data Science & Analytics angeboten.[43] Die TU Chemnitz bietet seit dem Wintersemester 2018/19 einen Masterstudiengang Data Science an, getragen von den Fakultäten Mathematik und Informatik, mit Schwerpunkt auf den mathematischen Grundlagen von Big Data und statistischem Lernen.[44] Die RWTH Aachen bietet einen englischsprachigen Masterstudiengang Data Science an.[45] Die NORDAKADEMIE bietet ab April 2021 einen Masterstudiengang Applied Data Science an.[46] An der Universität Leipzig wird seit dem Sommersemester 2020 der Studiengang Data Science angeboten.[47] In der Deutschschweiz bietet das IBAW die Ausbildung als Nachdiplomkurs an, der Abschluss «Data Science NDK HF» kann berufsbegleitend erworben werden.[48] Die Jacobs University, Bremen bietet ab dem Herbstsemester 2021/21 einen englischsprachigen Studiengang „Data Science for Society and Business“ an.[49] Einen weiteren berufsbegleitenden Masterstudiengang in Data Science and Business Analytics bietet die Hochschule der Medien Stuttgart an.[50] Außerdem bietet das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme (IAIS) Schulungen für Data Scientists an.[51] Die EMC Academic Alliance bietet ein Curriculum Data Science and Big Data Analytics an. Die Technische Hochschule Brandenburg bietet gemeinsam mit dem AWW e. V. einen weiterbildenden Zertifikatskurs „Data Science“ an.[52] Die Fachhochschule Südwestfalen bietet den berufsbegleitenden Masterstudiengang Studiengang Data Science an.[53] Die International University of Applied Sciences bietet einen Masterstudiengang Data Science an.[54] Das Institut Wirtschaftsinformatik und Data Science der FH Joanneum in Graz bietet den Masterstudiengang „Data Science and Artificial Intelligence“ an.[55]

Wirtschaft

In allen Wirtschaftszweigen werden heute große Datenmengen ausgewertet. Der Mangel an Data Scientists macht es für Unternehmen schwierig, die Daten richtig zu nutzen und konkret Erkenntnisse daraus zu ziehen. Daten werden als das „neue Gold“ gehandelt. Zudem ist der Markt an Spezialisten, die mit Datenarchitekturen und Datenmodellen umgehen können, fast nicht existent.

Auch in der Logistikbranche werden zukünftig immer mehr Data Scientists gesucht.

Eine weitere Branche ist die Gesundheitsbranche. Durch die genaue Analyse von Daten aus einem Krankenhausaufenthalt könnten individualisierte Behandlungen (Personalisierte Medizin) durch Ähnlichkeitsanalysen von Patientendaten abgeleitet und Medikationspläne optimiert werden.

In der Handelsbranche kann das Kaufverhalten der Menschen analysiert werden, um im weiteren Verlauf die Ursachen für Retouren herauszuarbeiten. So kann die Anzahl an Warenrücksendungen reduziert werden.

Siehe auch

Literatur

  • Cathy O’Neil, Rachel Schutt: Doing Data Science: Straight Talk from the Frontline. O’Reilly 2013. ISBN 1-4493-5865-9.
  • Dr. Barbara Wawrzyniak und Michael Herter (Hrsg.): Neue Dimensionen in Data Science. VDE Verlag 2022. ISBN 978-3-87907-721-2.
  • John W. Tukey (1962): The future of data analysis. Annals of Mathematical Statistics, Bd. 33, S. 1–67.
  • John D. Kelleher, Brendan Tierney: Data Science, The MIT Press Essential Knowledge Series, The MIT Press 2018, ISBN 978-0-262-53543-4
  • Johannes Kröckel: Data Analytics in Produktion und Logistik. Vogel Communications Group 2019. ISBN 978-3-8343-3419-0.
  • Maren Lübcke, Klaus Wannemacher: Vermittlung von Datenkompetenzen an den Hochschulen: Studienangebote im Bereich Data Science. HIS-HE, Hannover 2018. URL: Vermittlung von Datenkompetenzen an den Hochschulen: Studienangebote im Bereich Data Science (PDF; 1,1 MB)

Weblinks

Einzelnachweise

  1. Dhar, V. (2013): Data science and prediction. Communications of the ACM 56 (12): 64. doi:10.1145/2500499
  2. Jeff Leek (12. Dezember 2013): The key word in "Data Science" is not Data, it is Science. Simply Statistics.
  3. Kelleher, J. und Tierney, B. 2018. Data Science. MIT Press, Seite 55.
  4. Vasant Dhar: Data Science and Prediction | December 2013 | Communications of the ACM. In: acm.org. Dezember 2013, archiviert vom Original am 1. März 2017; abgerufen am 19. Juni 2018 (englisch).
  5. The key word in "Data Science" is not Data, it is Science · Simply Statistics. In: simplystatistics.org. 12. Dezember 2013, abgerufen am 6. Februar 2022 (englisch).
  6. Neue Dimensionen in Data Science, Was ist Data Science? 23. September 2022, abgerufen am 22. September 2022.
  7. Forbes, Gil Press: A Very Short History of Data Science. Mai 2013 (englisch).
  8. Escoufier et al., editors: Preface. In: Data Science and its Application (englisch). Academic Press, Tokyo 1995, ISBN 0-12-241770-4.
  9. a b Wu, C. F. J. (1997): Statistics = Data Science?. Abgerufen am 9. Oktober 2014.
  10. Identity of statistics in science examined. The University Records, 9. November 1997, The University of Michigan. Abgerufen am 12. August 2013.
  11. P. C. Mahalanobis Memorial Lectures, 7th series. P. C. Mahalanobis Memorial Lectures, Indian Statistical Institute. Abgerufen am 18. August 2013.
  12. Available Volumes. In: jst.go.jp. Japan Science and Technology Information Aggregator, Electronic, April 2012, archiviert vom Original am 3. April 2012; abgerufen am 13. Mai 2022 (englisch).
  13. Contents of Volume 1, Issue 1. In: jst.go.jp. Japan Science and Technology Information Aggregator, Electronic, April 2002, abgerufen am 13. Mai 2022 (englisch).
  14. The Journal of Data Science. (2003, January). Contents of Volume 1, Issue 1, January 2003. Abgerufen von Journal of Data Science (Memento vom 5. März 2016 im Internet Archive)
  15. National Science Board: Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century, National Science Foundation, abgerufen am 7. Juli 2016.
  16. Große Nachfrage nach Data Scientists. In: derstandard.at. 26. Februar 2015, abgerufen am 13. Mai 2022 (österreichisches Deutsch).
  17. Mathias Brandt: Infografik: Traumberuf Data Scientist. In: statista.com. 19. Februar 2015, abgerufen am 13. Mai 2022.
  18. Data Scientists – Die begehrtesten Alleskönner des 21. Jahrhunderts (Memento vom 28. Februar 2015 im Internet Archive), capgemini.com vom 20. Januar 2014, abgerufen am 28. Februar 2015.
  19. Fakultät Statistik - Bachelor Datenanalyse und Datenmanagement. In: tu-dortmund.de. Technische Universität Dortmund, archiviert vom Original am 27. Februar 2015; abgerufen am 14. September 2018.
  20. Universität Stuttgart, Fachbereich Informatik – Data Science. In: uni-stuttgart.de. Universität Stuttgart, abgerufen am 4. Juli 2016.
  21. a b Philipps-Universität Marburg, Fachbereich Mathematik und Informatik – Studiengänge. In: uni-marburg.de. Abgerufen am 13. Juni 2016.
  22. Fachbereich Elektrotechnik und Technische Informatik. In: hs-owl.de. Technische Hochschule Ostwestfalen-Lippe, abgerufen am 20. März 2018.
  23. Bachelor-Studium Digital Business & Data Science. In: ue-germany.de. Hochschule für Angewandte Wissenschaften Europa, abgerufen am 7. Mai 2018.
  24. Angewandte Data Science. In: uni-goettingen.de. Georg-August-Universität Göttingen, abgerufen am 27. April 2018.
  25. Mathematical Data Science. In: uni-goettingen.de. Georg-August-Universität Göttingen, abgerufen am 27. April 2018.
  26. Fakultät Wirtschaftsingenieurwesen: Wirtschaftsingenieurwesen (Bachelor). In: hs-mittweida.de. Hochschule Mittweida, abgerufen am 20. Februar 2020.
  27. Wirtschaftsinformatik Bachelor. In: hochschule-stralsund.de. Hochschule Stralsund, abgerufen am 12. Juni 2020.
  28. Angewandte Mathematik und Data Science (MAT) – Fakultät I. In: hs-hannover.de. Abgerufen am 20. Juli 2021.
  29. Digital Skills Academy. Abgerufen am 30. März 2022.
  30. Georg-August-Universität Göttingen - Öffentlichkeitsarbeit: Angewandte Data Science (M.Sc.) - Georg-August-Universität Göttingen. Abgerufen am 9. November 2021.
  31. Project Management and Data Science. In: htw-berlin.de. Abgerufen am 13. Mai 2022.
  32. Hochschule Darmstadt, FB I und FB MN: Masterstudiengang Data Science (Memento vom 7. März 2017 im Internet Archive). Abgerufen am 28. April 2016.
  33. Data Science (Master). In: uni-muenchen.de. 10. August 2016, abgerufen am 22. November 2016.
  34. Neuer Masterstudiengang Data Science (Memento vom 4. März 2016 im Internet Archive), auf uni-muenchen.de
  35. Management & Data Science. In: leuphana.de. Abgerufen am 13. Mai 2022.
  36. Data Science als neuer Studiengang an der Uni Linz, futurezone vom 19. August 2014, abgerufen am 28. Februar 2015.
  37. Technische Universität Dortmund - Masterstudium Datascience. Abgerufen am 28. Februar 2015.
  38. Otto-von-Guericke Universität Magdeburg - Data and Knowledge Engineering. Abgerufen am 28. Februar 2015.
  39. Friedrich-Schiller-Universität Jena – Masterstudium Computational and Data Science. Abgerufen am 28. Februar 2015.
  40. Data Science Beuth Hochschule. Abgerufen am 31. Mai 2017 (englisch).
  41. APA – Erstes Data Science Masterstudium startet in Salzburg (Memento vom 8. Oktober 2016 im Internet Archive). Abgerufen am 12. September 2016.
  42. Data Science, Masterstudium. In: plus.ac.at. Abgerufen am 13. Mai 2022.
  43. Informatik Master – Studienverlauf. Hochschule Offenburg, archiviert vom Original am 28. März 2017; abgerufen am 27. Juli 2018.
  44. Data Science TU Chemnitz. In: tu-chemnitz.de. Abgerufen am 28. November 2020.
  45. Data Science M.Sc. - RWTH AACHEN UNIVERSITY - Deutsch. In: rwth-aachen.de. RWTH Aachen University, abgerufen am 12. November 2018.
  46. Applied Data Science M.Sc. In: nordakademie.de. Abgerufen am 25. November 2020.
  47. Universität Leipzig: Data Science M. Sc. In: uni-leipzig.de. Abgerufen am 30. Juni 2021.
  48. Studiengang Data Science. In: nordakademie.de. IBAW, abgerufen am 17. Dezember 2020.
  49. Data Science for Society and Business (MSc). In: jacobs-university.de. Abgerufen am 13. Mai 2022.
  50. Studiengang Data Science - Hochschule der Medien. In: hdm-stuttgart.de. Abgerufen am 13. Mai 2022.
  51. Data-Scientist-Schulungen. In: fraunhofer.de. Abgerufen am 13. Mai 2022.
  52. Zertifikatskurs „Data Science (FH)“. In: Fachhochschule Brandenburg. Fachhochschule Brandenburg, 13. August 2015, abgerufen am 3. September 2015.
  53. Data Science (M.Sc.) (berufsbegleitend). In: Fachhochschule Südwestfalen. Fachhochschule Südwestfalen, archiviert vom Original am 20. April 2021; abgerufen am 1. März 2021.
  54. Master in Data Science | Online Studies | IU. In: iu.org. Abgerufen am 30. März 2022 (englisch).
  55. FH JOANNEUM. Abgerufen am 8. August 2022 (deutsch).