Hutter-Preis
Der Hutter-Preis ist ein Preis in der Informatik, der seit dem 6. August 2006 vergeben wird. Er belohnt Fortschritte in den Teilgebieten verlustfreie Datenkompression und künstliche Intelligenz. Er ist benannt nach Marcus Hutter, einem deutschen Informatiker, der zurzeit an der Australian National University lehrt.
Der Wettbewerb besteht darin, ein bestimmtes Textkorpus – nämlich die ersten 100 Mio. Zeichen einer bestimmten Version der englischsprachigen Wikipedia – möglichst stark und verlustfrei zu komprimieren. Dieses Korpus besteht zu 75 % aus natürlicher, englischer Sprache. Marcus Hutter und die anderen Mitglieder des Preiskomitees gehen davon aus, dass verlustfreie Datenkompression und künstliche Intelligenz dasselbe Problem darstellen – es gehe nämlich um das Verhalten eines Software-Agenten in einer ihm unbekannten, aber berechenbaren Umwelt. Sie argumentieren auch, dass die Voraussage des jeweils nächsten Satzbestandteils in einem Text Wissen und damit Intelligenz voraussetze. Einige Datenkompressionsverfahren stehen nämlich vor demselben Problem: Gelingt es, in einer Zeichenkette das nächstfolgende Zeichen zu erraten, muss dieses nicht abgespeichert werden.
Regeln
- Das eingereichte Programm muss ein selbstextrahierendes Archiv mit Größe S sein. Andernfalls bildet S die Summe aus der Größe des Programms und jener der mitgelieferten komprimierten Datei.
- Das Programm muss eine Datei erzeugen, die identisch ist mit der unkomprimierten Referenzdatei („enwik8“).
- Das Programm muss auf Windows oder Linux laufen (x86, 32 Bit).
- Das Programm darf keine Informationen beziehen, so zum Beispiel aus anderen Dateien oder Rechnernetzen.
- Hardware: Das Programm darf während höchstens 10 Stunden auf einem Pentium-4-Rechner mit 2 GHz Taktrate laufen. Der Computer darf 1 GB RAM besitzen, und auf der Festplatte dürfen höchstens 10 GB temporäre Dateien abgespeichert werden.
Das eingereichte Programm muss nicht quelloffen sein (Open Source).
Um den Preis zu gewinnen, muss der bisherige Rekord (Größe S des selbstextrahierenden Archivs) um mindestens ein Prozentpunkt unterboten werden. Für jeden Prozentpunkt werden 500 Euro Preisgeld ausgelobt.
Geschichte
Die Startlinie markierte die Software PAQ8F mit einem Wert von S = 18.324.887 Bytes. PAQ8F benötigte zur Dekompression der Daten fünf Stunden. Der derzeitige Rekord wurde am 23. Mai 2009 von Alexander Rhatuschnjak aufgestellt. Sein Programm „decomp8“ benötigte rund neun Stunden Laufzeit, und S betrug 15.949.688 Bytes.