Sie sind hier:
durchdenken.de
>
Dirk Lewandowski
>
Publikationen
> Web Information Retrieval
>
PDF-Version des Buches
Inhaltsverzeichnis
Vorwort
1 Einleitung
2 Forschungsumfeld
2.1 Suchmaschinen-Markt
2.2 Formen der Suche im WWW
2.3 Aufbau algorithmischer Suchmaschinen
2.4 Abfragesprachen
2.5 Arten von Suchanfragen
2.6 Nutzerstudien
2.7 Forschungsbereiche
3 Die Größe des Web und seine Abdeckung durch Suchmaschinen
3.1 Die Größe des indexierbaren Web
3.2 Die Struktur des Web
3.3 Crawling
3.4 Aktualität der Suchmaschinen
3.5 Das Invisible Web
4 Strukturinformationen
4.1 Strukturierungsgrad von Dokumenten
4.2 Strukturinformationen in den im Web gängigen Dokumenten
4.3 Trennung von Navigation, Layout und Inhalt
4.4 Repräsentation der Dokumente in den Datenbanken der Suchmaschinen
5 Klassische Verfahren des Information Retrieval und ihre Anwendung bei WWW-Suchmaschinen
5.1 Unterschiede zwischen klassischem Information Retrieval und Web Information Retrieval
5.2 Kontrolliertes Vokabular
5.3 Kriterien für die Aufnahme in den Datenbestand
5.4 Modelle des Information Retrieval
6 Ranking
6.1 Rankingfaktoren
6.2 Messbarkeit von Relevanz
6.3 Grundsätzliche Probleme des Relevance Ranking in Suchmaschinen
7 Informationsstatistische und informationslinguistische Verfahren
7.1 Textstatistische Verfahren
7.2 Nutzungsstatistische Verfahren
7.3 Informationslinguistische Verfahren
8 Linktopologische Rankingverfahren
8.1 Grundlagen linktopologischer Rankingverfahren: Science Citation Indexing
8.2 PageRank
8.3 Kleinbergs HITS
8.4 Hilltop
8.5 Evaluierung linktopologischer Verfahren
8.6 Problembereiche linktopologischer Rankingverfahren
8.7 Fazit linktopologische Verfahren
9 Retrievaltests
9.1 Aufbau und Nutzen von Retrievaltests
9.2 Aufbau und Ergebnisse ausgewählter Retrievaltests
9.3 Kritik an Retrievaltests
10 Verfahren der intuitiven Benutzerführung
10.1 Relevance Feedback
10.2 Vorschläge zur Erweiterung und Einschränkung der Suchanfrage
10.3 Klassifikation und Thesaurus
10.4 Clusterbildung
11 Aktualität
11.1 Bedeutung der Beschränkung nach der Aktualität der Dokumente
11.2 Funktionsfähigkeit der Datumsbeschränkung in Suchmaschinen
11.3 Möglichkeiten der Ermittlung von Datumsangaben in Web-Dokumenten
11.4 Aktualitätsfaktoren im Ranking
11.5 Spezialisierte Suchmaschinen für Nachrichten
11.6 Auswahl der gewünschten Aktualität durch den Nutzer
12 Qualität
12.1 Bedeutung der Beschränkung nach der Qualität der Dokumente
12.2 Qualitätsbeschränkungen bei der Recherche in Datenbank-Hosts
12.3 Identifizierung von Top-Quellen im WWW
12.4 Manuelle Einbindung von Top-Quellen
11.5 Automatisierte Einbindung von Invisible-Web-Quellen
12.6 Einbindung von Web-Verzeichnissen in Suchmaschinen
13 Verbesserung der Dokumentrepräsentation
13.1 Beschränkung auf den Inhaltsteil der Dokumente
13.2 Erweiterungen der Dokumentrepräsentation
13.3 Ersatz für die Nicht-Verwendbarkeit generischer Top-Level-Domains
13.4 Aufbereitung der Suchergebnisse in den Trefferlisten
14 Fazit und Ausblick
15 Literaturverzeichnis