Apache Giraph

aus Wikipedia, der freien Enzyklopädie
Apache Giraph
Basisdaten

Entwickler Apache Software Foundation
Erscheinungsjahr 2012
Betriebssystem plattformübergreifend
Programmiersprache Java
Lizenz Apache 2.0 Licence
http://giraph.apache.org

Apache Giraph ist ein verteiltes Graph-Analyse-System, das bei der Verarbeitung von Daten in sozialen Netzwerken verwendet wird.

Entwicklung

Giraph basiert auf einer 2010 von Google veröffentlichten Schrift zu deren Graph-Analyse-System Pregel und wurde zuerst von Yahoo entwickelt und dann an die Apache Software Foundation übergeben.[1] Im Mai 2012 wurde Giraph dort ein eigenständiges Software-Projekt.[2]

Technik

Giraph setzt auf Hadoop auf und macht dadurch die Analyse von großen Datenmengen möglich. Es handelt sich um eine Erweiterung der Map-Reduce-Implementierung von Hadoop.[3]

Einsatz

Außer von Yahoo[2] wird Apache Giraph seit 2013 auch von Facebook zum Betrieb der seiteneigenen Suchfunktionen eingesetzt. Dort konnten mithilfe der Software auf 200 Servern eine Billion (1012) Edges in 4 Minuten ausgewertet werden.[4][1]
Auch PayPal, Twitter und LinkedIn nutzen die Software.[3]

Einzelnachweise

  1. a b Joab Jackson: Facebook's Graph Search puts Apache Giraph on the map. PCWorld, 14. August 2013, abgerufen am 12. Februar 2016 (englisch).
  2. a b Graph processing platform Apache Giraph reaches 1.0. TheH Open (Heise online), 8. Mai 2013, abgerufen am 12. Februar 2016 (englisch).
  3. a b Thomas Joos, Nico Litzel: So setzen Sie Graphen in Big-Data-Umgebungen ein. Big Data Insider, 22. Juni 2015, abgerufen am 13. Februar 2016 (deutsch).
  4. Scaling Apache Giraph to a trillion edges. Facebook, abgerufen am 13. Februar 2016 (englisch).