Eine Suchmaschine besteht aus 4 Teilen:
Robotern (robots):
Roboter dienen der Suchmaschine um möglichst viele Adressen (URLs) von WWW-Seiten zu bekommen.
Was ist ein Roboter ?
(Roboter im Web) : Programm das Hyperlinks folgt und diese für seine Zwecke auswertet incl. einer rekursiven Verfolgung der enthaltenen Links.
Andere Namen dafür: Spider, Agent, Web Wanderer ...
Erster Roboter wurden 1993 eingesetzt um die Anzahl der Webseiten zu bestimmen.
Indexserver (search engine / indexer)
Die Suchmaschine steuert das Vorgehen der Roboter und analysiert die WWW-Seiten, die der Roboter liefert und erstellt die Indexdaten zu den Seiten.
Datenbank (database)
Die Datenbank dient zum Abspeichern der Indexdaten, zusätzlich wird der gerichtete Graph des Netzes gespeichert.
Abfrageserver (query server)
Der Abfrageserver bietet meist eine graphische Oberfläche in der die Suchanforderung eingegeben werden kann. Der Abfrageserver analysiert die Eingabe des Users und durchsucht die Datenbank nach den gewüschten Schlüsselwörtern.
|