|
Details:
Autor: |
Dr. Josef Herget / Studie über Suchmaschinen auf Websites |
Datum: |
30.11.2006 19:04:27 |
|
Die Hypothese ist zulässig, dass die Aufgabe der Suchfunktion und deren Wichtigkeit von den Personen, welche die technische Umsetzung und den Betrieb leisten, kaum respektiert wird. Selbst grundlegende Anforderung an die Datenhaltung der Suchapplikation wird in Bereichen vernachlässigt, welche einfach beherrschbar und einfach testbar sind: Aktualität und Vollständigkeit. Hauptgrund, zusätzlich zum geringen Augenmerk, ist vermutlich die passive Erschliessung der Daten über ein Crawling, das nicht nach Bedarf, aber zeit- oder lastgesteuert ist. Dies anstelle einer ereignisgesteuerten Aktualisierung.
5. Anfragen und Dokumente vergleichen
Ein Suchresultat wird berechnet, indem die Anfrage mit den erschlossenen Dokumenten verglichen wird. Das Vergleichen von Anfragen und Dokumenten wurde aufgrund folgender Subkriterien beurteilt: Auswertung der Anfrage, Ausdrucksstärke der Abfragesprache und Metadatenqualität.
Beim Vergleichen von Anfragen und Dokumenten geht es nicht primär um die Suchqualität, sondern darum, ob die Auswertung einer Benutzeranfrage technisch sauber realisiert wurde, was natürlich auch einen Einfluss auf die Suchqualität hat. Der Boxplot zeigt schlechte Resultate (50% kommen nicht über 0.26, 75% kommen nicht über 0.3 und niemand kommt über 50%).
Die Retrieval-Applikationen schneiden bei der Anfrageausführung am besten und bei der Metadatenqualität am schlechtesten ab. Besonders auffällig ist, dass 75% alle Applikationen eine schlechte Metadatenqualität aufweisen, d.h. Werte zwischen 0.0 und 0.4. Die Maximalwerte zeigen, dass es durchaus möglich ist, beim Vergleichen von Anfragen und Dokumenten gute Werte zu erzielen.
Die Site-Suchen, welche bei der Anfrageausführung schlecht abgeschnitten haben, sind eher Datenbank- als Retrieval-Applikationen. Ihnen fehlt die erforderliche Robustheit, um mit beliebigen unstrukturierten Abfragen fertig zu werden. Die beim Retrieval-Problem inhärente Unsicherheit (Abschnitt 1.4) wird bei Datenbankapplikationen nicht berücksichtigt.
[Vorherige] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 [...] [Nächste]
|