Benutzer:Parzi/Internetrecherche

aus Wikipedia, der freien Enzyklopädie
Construction.svg Dieser Artikel ist in Entstehung und noch nicht Bestandteil der freien Enzyklopädie Wikipedia.

Sollten Sie über eine Suchmaschine darauf gestoßen sein, bedenken Sie, dass der Text noch unvollständig ist und Fehler oder ungeprüfte Aussagen enthalten kann. Wenn Sie Fragen zu dem Thema haben, nehmen Sie am besten Kontakt mit dem Autor auf.

Recherche im Internet

Qualität von Online-Dokumenten

Jeder kann alles im Internet veröffentlichen, eine Qualitätssicherung ist kaum vorhanden. Es existieren Webseiten mit skurrilen Berichten, mit Beiträgen zu Außerirdischen, mit allgemeiner Paranoia, Urban Legends sowie mit kriminellen Inhalten. Abgesehen von solchen außergewöhnlichen Beispielen: Private Webseiten enthalten selten alle Angaben, die wünschenswert sind, um ihre inhaltliche Zuverlässigkeit nach den Kriterien wissenschaftlicher Publikationen zu überprüfen, denn die meisten privaten Webseiten sind schlichtweg keine wissenschaftlichen Publikationen. Der Informationswert verschiedener Dokumentengattungen (Alltagsbeispiele: Werbematerial, Tagespresse, Fachzeitschriften, gedrucke Bücher, handschriftliche Tagebücher, Poesiealben) ist ziemlich unterschiedlich.

Viele Informationen im Web sind also unvollständig, unbelegt, argumentativ nicht lückenlos nachvollziehbar, überholt, falsch oder absichtsvoll (Werbung) wie die gesponserten Links. Gelegentlich werden Texte im Internet sogar durch Hacker verfälscht, also ohne Einwilligung und gegen die Überzeugung des Web-Site-Inhabers.

Informationen können falsch sein, weil eine Rechtsgrundlage geändert wurde, die Informationen daraufhin aber nicht aktualisiert wurde, oder Informationen werden vorsätzlich gefälscht (Zensur, Propaganda, ideologische Berichterstattung). Der Wert vieler Informationen altert, nimmt mit der Zeit ab, so dass viele Informationen schon nach wenigen Jahren nahezu unbrauchbar werden, außerdem entstehen immer wieder neue Fachgebiete.

Flüchtigkeit des World Wide Web

Die Anzahl aller Webseiten wächst schneller als die Bandbreite, die Suchmaschinen zur Verfügung steht, diese Webseiten zu indizieren. Auch die beste Suchmaschine indizierte bei einer Untersuchung[1] nur etwa 16 % der Inhalte des Internets, alle untersuchten Suchmaschinen gemeinsam erreichten 42 %. Suchmaschinen legen sich eigene Datenbanken an, in denen sie Informationen (Zeichenfolgen als Stichwörter, Ankertexte) der Webseiten ablegen, sie besitzen keinen inhaltlich erschlossenen Volltextindex der Webseiten. Gesucht wird also nicht im Internet, sondern in den Datenbanken der Suchmaschinen. Da Webcrawler ständig das Internet durchsuchen, wachsen die Datenbanken der Suchmaschinen ständig und verändern sich. Dieselben Anfragen können so an aufeinander folgenden Tagen unterschiedliche Ergebnisse liefern. Aufbau und Inhalt von vielen Webseiten werden oft geändert. Inhaltlich bedeutsame Webseiten sind daher nicht immer wiederauffindbar und eine genau gleiche Suche führt schlimmstenfalls ins Leere. Im Internet nicht mehr vorhandene Webseiten können mit Glück in der Wayback-Machine aufgerufen werden. Die Halbwertszeit von Hyperlinks beträgt etwa 55 Monate,[2] die Lebenszeit eines Dokuments im WWW 2,5 Monate.[3]

Informationskompetenz

Über das Internet können mehr Menschen denn je auf eine erhebliche Menge von Informationen zugreifen. Der schier unüberschaubare Umfang der auf diesem Wege zugänglichen Angebote, macht es schwer, die Spreu vom Weizen zu trennen, das heißt darin mit vertretbarem Aufwand hochwertige Informationen auszumachen (Informationskompetenz).

Jemand, der sich mit einem Thema noch nicht auskennt, ist oft nicht in der Lage, Informationsfunde zu diesem Thema überhaupt richtig zu verstehen und einzuschätzen. Zum Beispiel konnten Anwender in einer Studie der amerikanischen Centers for Disease Control and Prevention die Ergebnisse einer Suche nach gesundheitlichen Fragen im Internet nicht kritisch und zuverlässig beurteilen. Das heißt die Bewertung von neu aufgefundenen Hinweisen setzt oft Fachkenntnisse voraus, die viele Menschen nicht haben.

Anhaltspunkt für höherwertige Informationen ist z. B. die Begutachtung durch einen Redakteur oder eine Überprüfung nach wissenschaftlichen Regeln (etwa durch doppelblindes Peer-Review).

Internetquellen sollten richtig bewertet[4] oder mit einer Dokument-basierten Internet-Recherche[5] gesucht werden.

Obwohl eine Vielzahl von Suchdiensten bereit steht, um Informationen nachzuweisen, verwenden die meisten Internetnutzer nur wenige marktführende Suchmaschinen (Google) und Webverzeichnisse (Yahoo), die populärwissenschaftliche Webseiten genauso nachweisen und bewerten wie wissenschaftliche.

Suchwerkzeuge

Nach Wolfgang G. Stock[6] von der Heinrich-Heine-Universität Düsseldorf lassen sich Weltregionen digitaler Informationen unterscheiden: das Oberflächenweb und das Deep Web. Im Oberflächenweb kann mit den Suchwerkzeugen Suchmaschine, Webkatalog, Metasuchmaschine und Webportal, im Deep Web in Datenbanken und bei Hosts recherchiert werden. Unter Querweltein-Ergänzungen versteht Stock Links vom Oberflächenweb ins Deep-Web (z. B. Brückenseiten) oder umgekehrt. Hybrid-Systeme sind Suchwerkzeuge, die quer durch die Internetwelten Recherchen anbieten.

Hochwertige Quellen durch Fachinformationszentren

In Deutschland sind Fachinformationszentren mit staatlicher und privater Förderung mit der Aufgabe betraut, in ihrem jeweiligen Fachgebiet unter redaktionellem Einsatz, Literatur zu sammeln, aufzubereiten, zu klassifizieren und im Internet in Datenbanken und spezialisierten Suchmaschinen als Quellen mit gesicherter Information bereit zu stellen.

Beispiele:

  • FIZ Technik, Frankfurt Main
  • Fachinformationszentrum Chemie, Berlin
  • Fachinformation Karlsruhe
  • Technische Informationsbibliothek, Hannover

Weitere Probleme von Suchmaschinen

Von der Veröffentlichung einer Webseite bis zur Aufnahme in den Suchmaschinenindex können Wochen bis Monate vergehen. Aktuell im Internet bereitgestellte Dokumente können Suchmaschinen nicht sofort nachweisen. Zudem gibt es für neue Webseiten kein sinnvolles Ranking. Auch technische Manipulationen (Suchmaschinenoptimierung, Suchmaschinenspam, Linkfarm) und erkaufte Platzierungen beeinflussen die Sortierung der Ergebnislisten (Page-Rank).

Recherchedienstleister

  • Neben kommerziellen Recherchediensten gibt es mehrere Webseiten, bei denen Privatleute Fragen zu verschiedenen Themen beantworten, beispielsweise Meta-re-search und Wikipedia:Auskunft.

Das Auffinden von Informationen für Zwecke der Wikipedia erleichtert die Seite Wikipedia:Recherche, die natürlich auch für andere Informationssuchende nützlich sein kann.

  1. Siehe Lawrence and Gilles, 1999
  2. Siehe die Netzeitung
  3. Siehe die Neue Zürcher Zeitung vom 13. Oktober 2003
  4. Siehe die Anleitung der Universität Münster
  5. Siehe Anleitung der FH Heilbronn
  6. Siehe die Mitarbeiter-Seite
  7. Siehe Internetbibliothek.de