Eureqa

aus Wikipedia, der freien Enzyklopädie
Eureqa
Basisdaten

Entwickler Michael Schmidt (Cornell University, NY) und Hod Lipson (Columbia University, NY); Vertrieb: Nutonian, Inc.
Betriebssystem Windows, Linux, Mac OS
Kategorie Künstliche Intelligenz
Lizenz proprietär
www.nutonian.com

Eureqa ist der Markenname eines Computerprogramms, das 2007 im Artificial Intelligence Lab der Cornell University entwickelt und seit 2011 von Nutonian, Inc. mit zusätzlichen Funktionen und Leistungen kommerziell angeboten wird. Die Modelling-Engine von Eureqa verwendet evolutionäre Algorithmen, um mit künstlicher Intelligenz mathematische Gleichungen aus umfassenden Datensätzen in einfachster Form abzuleiten, siehe Symbolische Regression.

Entwicklung

Vorgeschichte

Seit den 1970er Jahren engagierten sich Unternehmen in Data Science, d. h. Extraktion von Information aus großen Datenmengen, indem sie Teams von Wissenschaftlern beschäftigten, die mit Programmen und Programmiersprachen wie R, Python, SAS (Statistical Analysis System) und SQL sowie mit ihrer eigenen Kenntnis von mathematischen und statistischen Zusammenhängen prädiktives und statistische Modellierung durchführten.[1][2]

Konzept

Im Jahr 2007 ging Michael Schmidt, zu diesem Zeitpunkt Doktorand an der Cornell University, Abteilung Computational Biology, von der Annahme aus, dass es möglich sein sollte, mathematische Zusammenhänge in Sets von experimentellen oder statistischen Daten durch evolutionäre Algorithmen maschinell aufzuklären. Eine Untersuchung dieser Herangehensweise sei sinnvoll, besonders unter den Aspekten, dass sowohl die Komplexität der untersuchten Probleme als auch die Menge an Daten in der Forschung immer weiter zunehmen.[3]

Unter seinem Betreuer Hod Lipson, dem Direktor des Creative Machines Lab der Columbia University, entwickelte Schmidt eine mit künstlicher Intelligenz arbeitende Modelling-Engine als „virtual data scientist“ (virtueller Datenwissenschaftler[4]), der aus vorgegebenen Daten automatisch und zeitsparend prädiktive und analytische Modelle erstellt und diese den (menschlichen) Experten zur Verfügung stellt.[5] Dabei funktioniert das Programm nicht als „Black Box“, sondern die einzelnen Modelling-Schritte können in situ nachvollzogen und Daten können jederzeit hinzugefügt oder entfernt werden.[6]

Die Benennung „Eureqa“ erfolgte nach dem angeblich von Archimedes getätigten Ausruf „Eureka!“ (

εὕρηκα

) (Ich habe [es] gefunden), wobei das „k“ durch ein „q“ ersetzt wurde, um die Assoziation mit dem Wort equation (Gleichung) hervorzurufen.[7]

Evolutionäre Suchmethode

Das Programm wendet zufällig ausgewählte Gleichungen auf die eingegebenen Daten an.[8] Die meisten Gleichungen liefern dabei keine weiterführenden Ergebnisse, aber einige Gleichungen liefern bessere Ergebnisse in der Kurvenanpassung als andere. Diese Gleichungen bilden dann die Grundlage zu einem erneuten, als „evolutionäre Suche“ (unter mehrere Milliarden von Gleichungen und Gleichungselementen) bezeichneten Prozess,[9] bis schließlich eine Gleichung, das Resultat, die anfangs eingegebenen Daten optimal in Zusammenhang bringt.

Zusätzlich lernt das Programm und verwendet erfolgreiche Gleichungselemente aus vorherigen Suchen zur Lösung von neuen Problemen. Auch bewertet das Programm gefundene Lösungen nach ihrer Einfachheit, d. h. eine weniger komplexe Formel erhält den Vorzug vor einer komplexeren Formel, wenn beide Formel dieselbe Datenanpassung liefern.

Marketing

  • Anfang November 2009 wurde das Programm als Freeware zum Download freigegeben.[10]
  • Seit Juni 2011 wird Eureqa von Nutonian Inc. als kommerzielles Paket mit Zusatzprogrammen und zusätzlichen Leistungen angeboten.[11]
  • Seit 2014 ist „Eureqa“ als Markenname geschützt.[12]

Anwendungsbeispiele

Der Nutzen der Software, so Lipson, liegt besonders in den Forschungsgebieten, in denen sehr viele Daten anfallen, für die es aber noch keine erklärende Theorie gibt, wie diese Daten zusammenhängen.[8] Aus diesem Grund bat Lipson Wissenschaftler verschiedener Disziplinen, ihre Ergebnisse zugänglich zu machen, um die Vielseitigkeit von Eureqa zu testen.[13]

Physik

Einfacher harmonischer Oszillator

Biologie

  • In der Oktober-Ausgabe von Physical Biology (2011) beschrieb Lipson daraufhin ein Experiment mit Daten zur rhythmischen Fluktuation von Glukose („glykolytische Oszillation“) und Glukose umsetzenden Enzymen, wenn Hefezellen anaerob werden. Dessen Eureqa-Analyse lieferte sieben bekannte Gleichungen mit definierten Konstanten. Diese Konstanten interessierten wiederum John Wikswo (Vanderbilt University, Nashville) und Jerry Jenkins (HudsonAlpha Institute for Biotechnology, Huntsville), die die Daten geliefert aber Schwierigkeiten gehabt hatten, diese Konstanten zu bestimmen.[13] Wikswo bezeichnete diesen Forschungsansatz als „automated biology explorer“ („automatischen Biologieerforscher“[4]).[15]
Bacillus subtilis in der Gram-Färbung. Die ovalen, nicht gefärbten Strukturen sind die Endosporen.
  • Der Biologe Gurol Suel (University of Texas) untersucht das Wachstum von Bacillus subtilis. Er hatte bereits ein mathematisches Modell mit 16 Variablen entwickelt, das die experimentellen Daten zu Konzentrationen von verschiedenen Proteinen und subzellulären Faktoren im Zusammenhang mit der Endosporenbildung von B. subtilis beschreiben konnte. In einer Zusammenarbeit mit Lipson – und nach einem anfänglichen Fehlschlag mit dem Programm – lieferte erneutes Modelling mit Eureqa ein überraschendes Resultat: Eine neue Gleichung mit nur 7 Variablen konnte die vorliegenden Daten Suels in Zusammenhang bringen und lieferte sogar mit danach erzeugten, neuen Daten konsistente Ergebnisse.[7] Doch diesem interessanten Ergebnis steht gegenüber, dass bisher weder Lipson noch Suel die Theorie hinter der neuen Gleichung schlüssig erklären können.[16]

Weitere wissenschaftliche Fachgebiete

Rezeption

Bis 2012 haben 20.000 Personen,[7] bis 2015 mehr als 80.000 Personen[30] das Programm heruntergeladen und verwendet, darunter Forscher, Studenten und Fortune-500-Unternehmen[31] und es auf so unterschiedliche Fragestellungen wie das Verhalten von Tieren in Rinderherden oder die Bewegungen von Aktien an der Börse angewendet.[10]

In Bezug zu Eureqa hat der Mathematiker Steven Strogatz die Vermutung geäußert, dass derzeit noch theoretisch unerklärbare mathematische Resultate Vorboten eines „end of insight“[32] sein könnten, wenn Computerprogramme in der Lage sind, wissenschaftliche Zusammenhänge herzustellen, die Menschen zwar als korrekt erkennen, ihnen aber intellektuell nicht mehr folgen können.[33]

DaSilva argumentiert in eine ähnliche Richtung. Er hebt als Besonderheit „Eureqa’s ability to ‘discover’ (i.e. rediscover) the laws of nature“[34] heraus und vermutet, dass in Zukunft menschliche Wissenschaftler zusammen mit Netzwerken von evolutionär-algorithmischen Programmen Experimente und Auswertungen durchführen und Resultate finden werden, die [in der Technik] weiterverwendet werden, ohne dass die naturwissenschaftlichen Prinzipien dahinter verstanden werden (können), auf denen diese Resultate beruhen.[35]

Weblinks

Einzelnachweise

  1. Gregory Piatetsky: Four main languages for Analytics, Data Mining, Data Science. In: www.kdnuggets.com . KDnuggets. Abgerufen am 19. Mai 2016.
  2. Michael Schmidt: Clarifying the uses of artificial intelligence in the enterprise. In: TechCrunch . TechCrunch. Abgerufen am 19. Mai 2016.
  3. Dennis Keohane: Nutonian – At the Cutting Edge of Technology, Science, and Data Analysis. In: www.venturefizz.com . VentureFizz.
  4. a b Freie Übersetzung
  5. Antonio Regalado: 35 Innovators Under 35. In: MIT Technology Review. 19. August 2014. Abgerufen am 19. Mai 2016.
  6. Dan Woods: How Nutonian’s Machine Intelligence Model Shows How People And Technology Can Be Partners, Forbes/Tech, 13. August 2015; abgerufen am 8. August 2016.
  7. a b c Asaf Shtull-Trauring: An Israeli professor’s 'Eureqa' moment, Haaretz, 3. Februar 2012; abgerufen am 4. August 2016.
  8. a b Kenneth Chang: Hal, Call Your Office: Computers That Act Like Physicists, New York Times, 2. April 2009; abgerufen am 3. August 2016.
  9. Farhad Manjoo: Will Robots Steal Your Job?, Slate, 30. September 2009; abgerufen am 4. August 2016.
  10. a b Brandon Keim: Download Your Own Robot Scientist, Wired, 3. Dezember 2009; abgerufen am 4. August 2016.
  11. CBIG Consulting Leverages Cutting-Edge Eureqa Software to Disrupt Analytic Marketplace and Expand Data Science Practice, prweb, 19. Februar 2014; abgerufen am 9. August 2016.
  12. Handelsname beantragt am 13. März 2013; Registrierung erhalten am 17. Juni 2014; abgerufen am 8. August 2016.
  13. a b Rachel Ehrenberg: Software Scientist, Science News Digital, 14. Januar 2012; abgerufen am 4. August 2016.
  14. Michael Schmidt und Hod Lipson: Distilling Free-Form Natural Laws from Experimental Data, Science Bd. 323, Nr. 5924 (3. April 2009), S. 81–85; abgerufen am 3. August 2016.
  15. David Salisbury: Robot biologist solves complex problem from scratch, Vanderbilt University, 13. Oktober 2011; abgerufen am 6. August 2016.
  16. David Weinberger: Too Big to Know: Rethinking Knowledge Now That the Facts Aren't the Facts, Experts Are Everywhere, and the Smartest Person in the Room Is the Room. Basic Books, 7. Januar 2014, ISBN 978-0-465-08596-5, S. 129.
  17. Literaturliste (Auswahl) von Publikationen im Gebiet Astronomie, zu deren Erstellung Eureqa eingesetzt wurde.
  18. Literaturliste (Auswahl) von Publikationen im Gebiet Chemie, zu deren Erstellung Eureqa eingesetzt wurde.
  19. Literaturliste (Auswahl) von Publikationen im Gebiet Mechanik/Biomechanik, zu deren Erstellung Eureqa eingesetzt wurde.
  20. Literaturliste (Auswahl) von Publikationen im Gebiet Materialkunde, zu deren Erstellung Eureqa eingesetzt wurde.
  21. Literaturliste (Auswahl) von Publikationen im Gebiet Informatik, zu deren Erstellung Eureqa eingesetzt wurde.
  22. Literaturliste (Auswahl) von Publikationen im Gebiet Naturanaloge Optimierungsverfahren, zu deren Erstellung Eureqa eingesetzt wurde.
  23. Literaturliste (Auswahl) von Publikationen im Gebiet Medizin, zu deren Erstellung Eureqa eingesetzt wurde.
  24. Literaturliste (Auswahl) von Publikationen im Gebiet Neurologie, zu deren Erstellung Eureqa eingesetzt wurde.
  25. Nicholas Allgaier und Ryan McDevitt: Reverse Engineering the Brain with Eureqa (PDF; 363 kB); abgerufen am 4. August 2016.
  26. Literaturliste (Auswahl) von Publikationen im Gebiet Psychologie, zu deren Erstellung Eureqa eingesetzt wurde.
  27. Literaturliste (Auswahl) von Publikationen im Gebiet Umweltwissenschaften, zu deren Erstellung Eureqa eingesetzt wurde.
  28. Literaturliste (Auswahl) von Publikationen im Gebiet Musik, zu deren Erstellung Eureqa eingesetzt wurde.
  29. Literaturliste (Auswahl) von Publikationen im Gebiet Allgemeine Themen, zu deren Erstellung Eureqa eingesetzt wurde.
  30. Angabe von Nutonian.
  31. Liste einiger Firmen, die Kunden von Nutonian Inc. sind; abgerufen am 11. August 2016.
  32. Freie Übersetzung: „Ende der Einsicht“ oder „Ende des Verstehen-Könnens“.
  33. Samuel Arbesmann: Explain It to Me Again, Computer. What if technology makes scientific discoveries that we can’t understand?, Slate, 25. Februar 2013; abgerufen am 10. August 2016.
  34. Freie Übersetzung: die Fähigkeit Eureqas, Naturgesetze zu 'entdecken' (d. h. wiederzuentdecken).
  35. Extropia DaSilva: Eureqa! Signs of the Singularity?, h Plus Magazine, 25. März 2011; abgerufen am 6. August 2016.