DiktionDiktion

In der Informatik ist eine Suchmaschine ein Softwaresystem für die Informationsbeschaffung, das dazu dient, auf einem oder mehreren Computersystemen gespeicherte Informationen zu finden. Suchmaschinen entdecken, durchsuchen, transformieren und speichern Informationen zum Abruf und zur Präsentation als Antwort auf Benutzeranfragen. Die Suchergebnisse werden in der Regel in einer Liste dargestellt und als Treffer bezeichnet. Die am weitesten verbreitete Art von Suchmaschine ist eine Web-Suchmaschine, die nach Informationen im World Wide Web sucht.

Eine Suchmaschine besteht in der Regel aus den folgenden vier Komponenten: einer Suchoberfläche, einem Crawler (auch Spider oder Bot genannt), einem Indexer und einer Datenbank. Der Crawler durchforstet eine Dokumentensammlung, zerlegt den Text des Dokuments und ordnet Surrogate für die Speicherung im Index der Suchmaschine zu. Online-Suchmaschinen speichern Bilder, Linkdaten und Metadaten zu einem Dokument.

Funktion

Vom Prinzip her funktionieren Suchmaschinen in der Regel:

Manche Webseiten bieten eine Suchmaschine als Hauptfunktion an; in diesem Fall bezeichnet man die Seite selbst als „Suchmaschine“. Sie durchsuchen das Web ohne menschliches Zutun, was sie von Verzeichnissen unterscheidet. Sie basieren auf „Robotern“, auch „Bots“, „Spiders“, „Crawlers“ oder „Agents“ genannt, die die Websites in regelmäßigen Abständen automatisch durchsuchen, um neue Adressen (URLs) zu entdecken. Sie folgen den Hyperlinks, die die Seiten miteinander verbinden, eine nach der anderen. Jede identifizierte Seite wird dann in einer Datenbank indexiert, auf die Internetnutzer dann anhand von Schlüsselwörtern zugreifen können.

Suchmaschinen gelten nicht nur für das Internet: Einige Suchmaschinen sind Software, die auf einem Personalcomputer installiert wird. Diese sogenannten Desktop-Suchmaschinen kombinieren die Suche in den auf dem PC gespeicherten Dateien mit der Suche in Websites - Beispiele sind Copernic Desktop Search, Windex Server etc.

Es gibt auch Metasuchmaschinen, d. h. Websites, auf denen dieselbe Suche gleichzeitig in mehreren Suchmaschinen durchgeführt wird und die Ergebnisse dann zusammengeführt werden, um sie dem Internetnutzer zu präsentieren.