Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen (Bachelorarbeit)
Status: beendetDescription:
Im Rahmen des Projektes CLARIN-D werden u.a. verteilte Suchverfahren für Anfragen auf digitale Textressourcen implementiert (“Federated Content Search”, http://weblicht.sfs.uni-tuebingen.de/Aggregator/).
Ziel der Arbeit ist die Entwicklung (oder Weiterentwicklung) eines Endpunktes für diese Infrastruktur auf der Basis der Wortschatzkorpora (http://corpora.uni-leipzig.de) und der Protokolle SRU/CQL. Dabei soll die Suchmaschine nicht nur Volltextsuche sondern auch Anfragen auf verschiedenen weiteren Informationslayern (wie zum Beispiel Informationen zur Wortart oder Grundformen) ermöglichen. Der entwickelte Endpunkt soll zum Beispiel Anfragen wie “Belegstellen mit einer Präposition gefolgt vom Wort ‘Auto’” oder andere linguistische Anfragen erlauben.
Benötigt werden Kenntnisse in der Programmiersprache Java sowie gute Kenntnisse in SQL.
Author: Linda GräßlerAdvisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart | Dr.-Ing. Christoph Kuras