Boolsche Suche (AND, OR, NOT) /
Eine alte und einfache Methode in der Datenbank zu suchen ist mit Hilfe von logischen Operatoren. Mit der Methode kann keine Sortierung der Einträge erreicht werden. Je nachdem wie häufig oder speziell die Kombination der eingegebenen Wörter sind ist das Suchergebnis auch gut oder schlecht. Sie ist geeignet nach bestimmten Schlüsselwörter-Verknüpfungen zu suchen, die nur in den gesuchten Dokumenten vorkommen müßten.
Fuzzy Boolsche Suche (unschärfe Abweichung bei Schreibfehlern)
Sie funktioniert ähnlich der Boolschen Suche. Es werden zunächst alle Dokumente betrachtet bei der die logische Verknüpfung exakt zutrifft, danach wird eine logische Verknüpfung weggelassen und die gefundenen Dokumente zurückgeliefert, Es entsteht somit eine sortiere Liste, wobei die Ergebnisse mit der besten Übereinstimmung am Anfang stehen.
Auf Vektoren basierende Suche
Die Auftrittshäufigkeit jedes spezifizierten Begriffs in einem Dokument wird in Relation zu der Gesammtauftrittshäufigkeit des Begriffs gesetzt. Damit stehen die Dokumente näher am Anfang der Liste, in denen ein gesuchter Begriffe enthalten ist, der selten in der Datenbank ist oder der häufig in dem Dokument vorkommt.
Automatische Abfrageexpansionssuche
Überprüft die bei der ersten Abfrage gefundenen Dokumente, und bezieht bei der zweiten Abfrage Dokumente mit ein, in denen Begriffe enthalten sind, die sehr häufig in den gefundenen Dokumenten enthalten sind. Jede Suchmaschine verwendet solche oder ähnliche Methoden um ihre Datenbank zu durchsuchen. Die großen Suchmaschinen versuchen ihre Verfahren zu verbessern und weiter zu entwickeln, und werden da diese Algorithmen ein unmittelbares Produktionskapital darstellt, diese auch nicht veröffentlichen.
Unterstützung verschiedener Eingabetypen:
Logische Verknüpfung
Fast jede Suchmaschine unterstützt eine logische Verknüpfung der eingegebenen Begriffe, meinst kann man diese mit großgeschriebenen AND, OR und NOT, seltener mit Plus (+) und Minus (-) eingeben. Klammerung von boolschen Ausdrücken ist
manchmal auch möglich. Es gibt auch Suchmaschinen, die nur entweder Und-Suche (\'Search all words\') oder Oder-Suche (\'Search any of the words\') unterstützen.
Trunkierung
Mit einem \'*\' Stern wird angedeutet, daß die Suchmaschine nach Begriffen suchen soll, die mit einem bestimmen Wortstamm anfangen. z.B. alter* sucht nach Alter, Altersheim, Altersversorgung, ...
Phrasensuche
Manche Suchmaschinen erlauben auch die Möglichkeit Satzstücke zu suchen. Man muß den entsprechenden Satzteil in Anführungszeichen einschließen. (z.B. \"verteilte Datenbanken\") Worte im Zusammenhang (near/followed by) Es gibt Suchmaschinen bieten auch ein Suchkriterium bei dem der Abstand der Begriffe berücksichtigt wird. z.B. bei Altavista bedeutet near, daß der Abstand zwischen den Begriffen kleiner 6 Wörter sein muß. Suche nach bestimmten Feldern (Überschrift,Autoren,Datum,URL)
Die Suche nach bestimmten Feldern in HTTP-Seiten wird selten unterstützt. Altavista oder Hotbot bieten z.B. so eine Funktion.
Suchmodi (Einfache - Erweiterte Suche)
Die meisten Suchmaschinen unterscheiden zwischen zwei Eingabemodi. Eine Oberfläche die eine einfache schnelle Eingabe erlaubt, und eine zweite, mit der man die volle Funktionalität der Suchmaschine ausnutzen kann.
Sortierung
Eine Sortierung der Ergebnisliste wird meistens durchgeführt, wobei versucht wird die \"besten\" Ergebnisse an den Anfang zu plazieren, dies wird durch verschiedene Ranking Verfahren bewerkstelligt.
Ranking (Relevanzbeurteilung)
Für die Relevanzbeurteilung gibt es mehrere Methoden:
Anzahl gefundener Suchbegriffe in einem Dokument Funktion (Position) der gefundenen Begriffe z.B. Es werden Dokumente bevorzugt, die Begriffe beinhalten, die weiter oben in einem Text stehen oder die im Titel stehen, ...
Häufigkeit eines Suchwortes innerhalb eines Dokuments, Häufigkeit jedes Suchwortes innerhalb eines Dokuments geteilt durch die Häufigkeit des Suchwortes in der Datenbank
|