Hilltop-Algorithmus
aus Wikipedia, der freien Enzyklopädie
Der Hilltop-Algorithmus (Hilltop dt. „Bergspitze“) ist ein Verfahren, das eine große Menge verknüpfter Dokumente (beispielsweise dem World Wide Web) nach Relevanz bezüglich von Suchbegriffen sortiert. Im Gegensatz zum PageRank-Algorithmus wird also nicht der Wert eines Dokumentes bestimmt, sondern dessen Verbindung zu einem bestimmten Suchwort.
Geschichte
Der Algorithmus wurde von Krishna Bharat und George A. Mihaila an der University of Toronto entwickelt. Im Jahr 2003 erwarb Google das Patent.
Ablauf
Der Hilltop-Algorithmus besteht aus zwei aufeinanderfolgenden Phasen:
- Bestimmung der sogenannten Experten-Seiten zu einem Suchwort. Als Experten-Seiten werden beim Hilltop-Algorithmus Dokumente definiert, die auf eine große Anzahl unabhängiger Dokumente dieses Themas verweisen. Diese Experten-Seiten können automatisch ermittelt werden.
- Sortierung der Autoritäts-Seiten anhand der Häufigkeit und Relevanz der verweisenden Experten-Seiten. Autoritäts-Seiten sind definitionsgemäß Dokumente, auf die mindestens zwei unabhängige Experten-Seiten verweisen.
Weblinks
- Krishna Bharat, George A. Mihaila: Hilltop: A Search Engine based on Expert Documents (englischsprachige Veröffentlichung der Entwickler)
- Der Hilltop-Algorithmus