Dies ist die archivierte Webseite der ASV. Aktuellere Informationen finden Sie unter temir.org und über die Suchfunktion auf uni-leipzig.de
ASV-Label
Login

16px-feed-icon Qualifizierungsarbeiten View this page in English

Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps) (Diplomarbeit)

Status: beendet
Abgabedatum: 04.03.2010

Beschreibung:

Im Rahmen eines Projektes wird überprüft, inwiefern Forentexte zu einer fachspezifischen Qualitätsanalyse beitragen können. Dazu werden aus bestimmten Automobilforen relevante Informationen extrahiert. Aus diesen wird eine Dokumentenkollektion erstellt.

Um Analysen und Auswertungen durchführen zu können, muss eine Untermenge der Dokumentenkollektion ausgewählt werden. Zu diesem Zweck werden mit Hilfe eines Information Retrieval Systems alle Dokumente im Index adressiert, die ein bestimmtes Informationsbedürfnis erfüllen. Allerdings treten bei der Selektion von Dokumenten einige Unsicherheiten auf.

Diese Unsicherheiten resultieren aus der Diskrepanz zwischen dem Vokabular des suchenden Experten und dem Vokabular der Forentexte.

Das Problem der Unsicherheit der Freitextsuche wird als Problem zwischen Benennungen und Begriffen identifiziert und in der Arbeit als Problem der semantischen Vollständigkeit bezeichnet.

Zur Lösung des Problems wird im Rahmen der Diplomarbeit eine Wissensbasis in den Suchvorgang integriert. Das Ziel ist es, eine Erweiterung der Suchanfrage (Query-Expansion) über den Termen der originalen Suchanfrage durchzuführen.

So soll ein Framework bereitgestellt werden, welches die Freitextsuchfunktion unterstützen kann. Dabei soll semantisches Wissen in die Suche einfließen. Es muss unter anderem die Möglichkeit bestehen, Synonyme, Hyponyme, Hyperonyme und Übersetzungen zu den originalen Suchtermen hinzuzufügen. Es soll sichergestellt werden, dass diese Erweiterungen mit unterschiedlichen Gewichtungen in die originale Anfrage einfließen. Die semantischen Relationen sollen einerseits Fachvokabular (um die Suche durch Experten zu unterstützen) und andererseits allgemeinsprachliches Vokabular (um die Sprache der Foren adressieren zu können) repräsentieren.

Weiterhin soll das Generieren einer Vorschlagsliste unterstützt werden, um den Anwender bei seiner Recherche in der Dokumentenkollektion zu unterstützen. Ebenfalls soll evaluiert werden, inwiefern die Erweiterung der Suche automatisiert durchgeführt werden kann.

Autor: Jan Werrmann
Betreuer: Prof. Dr. Gerhard Heyer