Dies ist die archivierte Webseite der ASV. Aktuellere Informationen finden Sie unter temir.org und über die Suchfunktion auf uni-leipzig.de
ASV-Label
Login

16px-feed-icon Qualifizierungsarbeiten View this page in English

Abgeschlossene Arbeiten

2022

Bachelor- und Masterarbeiten im Infrastrukturprojekt Text+

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Erik Körner | Felix Helfer | Dr. Thomas Eckart

Text+ ist ein Konsortium der bundesweiten Initiative zum Aufbau einer nationalen Forschungsdateninfrastruktur (NFDI). Die Text+ Infrastruktur ist auf Sprach- und Textdaten ausgerichtet und konzentriert sich zunächst auf digitale Sammlungen, …

2020

Design moderner mobiler Wörterbuch-Anwendungen am Beispiel der Bantusprachen

Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart

2013

Erstellung eines Lehrkonzepts für den Einsatz des Programms Rapid Miner in den Vorlesungen Text Mining und Linguistische Informatik

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Andreas Niekler
Autor: Alexander Lust

In den Vorlesungen Linguistische Informatik und Text Mining soll die Data Mining Software Rapid Miner für die Lehre eingesetzt werden. Dafür müssen 2 Vorlesungen, 10 Lehreinheiten (RapidMiner) und 10 Übungen (RapidMiner) erstellt werden.
Die …

2012

Integration von Daten der Semantic Web/Linked Data-Community in ISOcat/RELcat

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart | Volker Boehlke
Autor: Dr. Jochen Tiepmar

2011

SimpleDB als Backend für Topic Maps Engines

Bachelorarbeit
Betreuer: Benjamin Bock | Jun.-Prof. Lutz Maicher
Autor: Hans-Henning Koch

Amazon SimpleDB (Ψ) ist ein Webservice, der die Grundfunktionalitäten einer Datenbank (Abfragen und Indexierung) zur Verfügung stellt. Der Service arbeitet eng mit dem Amazon Simple Storage Service (Amazon S3) und …

2010

Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Benjamin Bock
Autor: Sven Windisch

Aspekte der Automatisierung der Schlagwortvergabe am Beispiel des Libri-Produktkatalogs

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Antje Schlaf

Phrasenbasierte Stimmungsanalyse

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Robert Remus

Datenintegration heterogener Quellen im Kontext der eHumanities

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Autor: David Pansch

Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps)

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Jan Werrmann

Im Rahmen eines Projektes wird überprüft, inwiefern Forentexte zu einer fachspezifischen Qualitätsanalyse beitragen können. Dazu werden aus bestimmten Automobilforen relevante Informationen extrahiert. Aus diesen wird eine Dokumentenkollektion …

2009

Finding and Analyzing Social Networks in unstructured web log data using probabilistic topic modeling

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Patrick Jähnichen

Externe Masterarbeit am Max-Planck-Institut für Evolutionäre Anthropologie. Betreuer am MPI war Colin Bannard.

Textvervollständigung auf antiken Texten

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler

In Zeiten ständig wachsender Textmengen (bspw. Internet) steigt auch die Menge des darin gespeicherten Wissens. Um dieses Wissen extrahieren zu können, müssen speziell bei nicht lektorierten Texten (bspw. Web) relativ starke Textkorrekturen …

Konzeption, Implementierung und Evaluation eines TMQL Parsers und Interpreters

Masterarbeit
Betreuer: Jun.-Prof. Lutz Maicher

Durch zunehmende Komplexität der Datenstrukturen, welche mit Topic Maps modelliert werden, gewinnen Anfragesprachen, ähnlich wie SQL im Bereich relationaler Datenbanken, zunehmend an Bedeutung. TMQL ist …

TMCL Editor

Diplomarbeit
Betreuer: Jun.-Prof. Lutz Maicher

Bisher existiert kein standardisierter Ansatz zur Schema- bzw. Ontologiebeschreibung in Topic Maps.

Mit TMCL ist eine entsprechende Schemasprache derzeit in der ISO-Standardisierung. …

Morphologische Analyse von antiken Texten im sprach-evolutionärem Wandel

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Christine Voigtländer

2008

Sentence Boundary Detection

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Konstantin Sveds

Textanalyse und Korrektur von durch OCR-Verfahren gewonnenem Text

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Sven Teresniak
Autor: Ying Xu

Entfernung von Fehlern in durch OCR-Verfahren gewonnenem Text mittels der Verfahren und Datenbestände der ASV.

Models of random text production for investigating repetition and reuse in language development

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Ronny Melz
Autor: Frank Binder

Externe Diplomarbeit am Max-Planck-Institut für Evolutionäre Anthropologie. Betreuer am MPI war Colin Bannard.

Konzeption und Realisierung eines multilingualen Systems zur Erkennung benannter Entitäten

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Daniel Trabold

Topic-Maps-Middleware. Modellgetriebene Entwicklung kombinierbarer domänenspezifischer Topic-Maps-Komponenten

Diplomarbeit
Autor: Benjamin Bock

Das Topic-Maps-Datenmodell (TMDM) ist (seit seines Bestehens) Grundlage für
Entwicklung von Topic-Maps-Engines. Eine Topic-Maps-Engine ist eine
Programmbibliothek, die über eine Programmierschnittstelle (API) die …

Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Beziehungen aus dem Datenbestand der Wikipedia

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Daniel Kinzler

REST-basierter, virtueller Topic aps-View für unstrukturierte Text-Korpora

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Daniel Zimmermann

Modellierung des Entscheidungsprozesses und Entwicklung eines Werkzeugs zur Unterstützung der Grammatikerstellung für Sprachdialogsysteme

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Oleg Tag

Reader’s News – die personalisierte Zeitung

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Stephan Hoyer

2007

Untersuchung zur Klassifizierung von Texten nach Autoren bzw. Zeitungen unter zu Hilfenahme von statistischen und anderen Mitteln


Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Dominik Herold

Integration verbesserter Geodaten in den Wortschatz der Universität Leipzig

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Torsten Jolig

Chinesischer Wortschatz: Segmentierung, Erkennung von Organisationsnamen und Integrierung eines Wörterbuchs in die Korpus-Browser

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Bao Chun

Chinesischer Wortschatz: Textsammlung mit RSS. Textaufbereitung und statistische Analyse

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Bo Peng

Statistische Verfahren zur Ermittlung lokaler Ereignisse und damit verbundenen Personen aus Zeitungstexten am Beispiel berühmter Kriminalfälle

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Elke Klippstein

Syntaktische Analyse natürlicher Sprache unter Verwendung statistischer Kookkurenzanalyse

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Christian Hänig

Information-Retrieval in einem P2P-Netz mit Small-World-Eigenschaften -- Simulation und Evaluation des SemPIR-Modells

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Sven Teresniak

Nichtüberwachte Wörterbucherstellung aus quasiparallelem Text

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Andreas Pittelkau

Implementierung eines semantischen Taggers für die deutsche Sprache mit Hilfe eines Markov Modells

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Renfei Zang

Wortbedeutungsdisambiguierung mittels sprachunabhängiger, kookkurrenzbasierter Algorithmen

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sven Reuter

Extraktion von Redewendungen

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Christian Beutenmüller

Strategien, Konzepte und prototypische Entwicklung einer Software für die semiautomatische Analyse chronologischer Textmuster in Zeitscheibenkorpora

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer

Konzeption und Implementierung eines Topic-Maps-basierten Community-Portals

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Claudia Römer

Konzeption und Implementierung eines topic maps-basierten Community-Portals

Zum aktuellen Zeitpunkt existiert kein Community-Portal zum Thema Topic Maps-Technologien. Ein solches Online-Portal, soll Informationen zu relevanten Publikationen, …

Dokumenten-Clustering von tagesaktuellen Zeitungstexten auf der Grundlage der Wörter des Tages

Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Chun Cui

Klassifikation dynamischer Textströme – Eine Erweiterung der inhaltsbasierten Textkategorisierung

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Christian Sickert

Automatische Erstellung zweisprachiger Wörterbücher aus Paralleltexten – Ein sprachunabhängiger Ansatz

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Matthias Ongyerth

Automatische Extraktion von Termhierarchien aus Dokumentenkollektionen für die semantische Strukturierung

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Hans Friedrich Witschel
Autor: Florian Holz

2006

Automatic Extension of Semantic Lexicons with a Bootstrapping Algorithm

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Richard Socher

Schwierigkeiten bei der Anwendung vollständig-entscheidbarer Deduktionsalgorithmen auf reale Ontologien und deren Anwendung zur semantischen Analyse Englischer Texte

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Udo Stenzel

Data und Text Mining für das CRM am Beispiel ausgewählter Kundendaten

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Frank Schmiedbauer

Identifizierung und Entdeckung von Sprachen bei Texten des WWW durch Clustern der häufigsten Trigramme

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Antje Schlaf

Semantische Analyse der Linkstrukturen von Webseiten mit Hilfe von sprachstatistischen Methoden

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Peter Kurras

Ein Satzgenerator für das Deutsche und dessen Anwendung in der natürlichsprachlichen Ausgabe von Datenbankinhalten

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Mathias Rosenau

Architektur und Evaluation von Szenorien für die Integration von e-Learning Plattformen und Content Management Systemen

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Matthias Blenn

Flexibles Berechnen von Kookkurrenzen auf strukturierten und unstruktuierten Daten

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Marco Büchler

Extraktion semantischer Beziehungen aus natürlicher Sprache durch Nutzung sprachlichen Wissens aus der Kindersprache

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sandy Pleißner

Text Mining for Quality and Service

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Christian Lehmann

Clustering und Klassifikation von Personennamen

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Robert Lokaiczyk

Kontextsensitive und domänenspezifische Rechtschreibekorrektur durch Einsatz von Work-Assoziationen

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Rolf Sabsch

2005

Webbasierte Editierwerkzeug zum Wortschatz-Wörterbuch mit linguistischer Unterstützung

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Andreas Fritzsche

Textminingverfahren zur Ermittlung von Webseiten mit Stellenangeboten auf linguistisch-statistischer Basis

Diplomarbeit
Autor: Christian Lehmann

Angewandte Situationstheorie: Gewinnung von Informationen aus Text und Möglichkeiten der Verwendung

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Nicki Klett

Untersuchung sprachunabhängiger statistischer Verfahren für die Übersetzung von Fachbegriffen zur Unterstützung des Verstehens fremdsprachlicher Texte

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Lars Wachsmuth

Statistikbasierte Sprachidentifikation auf Satzbasis

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sven Teresniak

Korpussuchmaschine mit Berücksichtigung linguistischer Merkmale wie Flexion und Wortklasse

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Marcel Anacker

Konzeptionelle Zooms auf semantischen Netzen

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Martin Christian

Evaluation und Verknüpfung von Kookkurrenzen höherer Ordnung und Probabilistic Latent Semantic Analysis

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Marek Mahn

Vergleich von Verfahren zur Ermittlung des semantischen Ähnlichkeit von Websites auf Basis von Termvektoren und Linkstruktur

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sebastian Buntin

2004

Text, Wörter, Mophene – Möglichkeiten einer automatischen Terminologieextraktion

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Dr. Hans Friedrich Witschel

Extraktion von Textelementen mittels „spreading activation“ für indikative Textzusammenfassungen

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Michael Barth

Optimierung von Suchmechanismen in webbasierten eGovernment-Anwendungen anhand des Einsatzes von Methoden der Automatischen Sprachverarbeitung

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Patrick Mairif

Jahr nicht angegeben

PSI-Repository für linked Topic Maps

Masterarbeit
Betreuer: Benjamin Bock | Jun.-Prof. Lutz Maicher

Die konsistente Nutzung von Gegenstandsanzeigern (PSI, Ψ, subject identifier) ist die Grundlage für die semantische Interoperabilität in Topic Maps. Immer dann, wenn zwei Topics identische PSIs nutzen, werden sie zusammengeführt. Temporal und …

Bachelor- und Masterarbeiten im Infrastrukturprojekt CLARIN-D

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart

CLARIN-D ist eine auf Metadaten basierende Forschungsinfrastruktur für Geistes- und Sozialwissenschaften. Für die textorientierten Geisteswissenschaften sind interaktive Text-Analyse- und Annotations-Verfahren für typische eHumanities Anwendungen …

Limbic Maps als Klassifikationsgrundlage


Implementierung eines Morphologieanalysesystems


Automatische Wörterbucherstellung mittels Trans-Kookkurrenzen aus dem JRC-Acquis

Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Yan Wu

Graphische Visualisierung von Korpusdaten am Beispiel von Parallelkoordinaten

Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Sergej Vintgolc

Evaluierung von Hadoop und MapReduce-Algorithmen für ökonometrische Clusteranalysen

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Jun.-Prof. Lutz Maicher

Big data wird zunehmend in der ökonomischen Forschung wichtig. In dieser Arbeit sollen in Kooperation mit dem Fraunhofer MOEZ die Möglichkeit skalierbarer Verfahren für ökonometrische Clusteranalysen an einem konkreten Beispiel evaluiert werden. …

Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Sebastian Sander

Termextraktion auf antiken Texten

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler

Datenintegration heterogener Quellen im Kontext der eHumanities

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: David Pansch

Mental Maps: Aufbau von orts- und zeitabhängigen Bedeutungsräumen zum automatischen Erkennen politischer und gesellschaftlicher Zäsuren im historischen Kontext

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: David Stange

Local Text Reuse Detection mittels Diskreter Kosinustransformation auf Grafik-Hardware

Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler

Fragmentarische Autoren - Extraktion altgriechischer Eigennamen und Belegstellen auf Antiken Texten

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Maria Moritz

Visualisierung von Kookkurrenzgraphen

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Frederik Baumgardt

Multi-Label Klassifikation am Beispiel der sozialwissenschaftlicher Texte

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Jochen (*) Tiepmar
Autor: Nathanael Philipp

(im Rahmen des Projektvorhabens „Postdemokratie“, verbunden mit einer SHK-Stelle)

In einer umfassenden Dissertation (Scharkov 2012) wurden verschiedene Klassifikationsverfahren für ihre Eignung in den Sozialwissenschaften und der Medienanalyse …

Auswertung von Briefköpfen für die Dokumentklassifikation

Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Daniel Isemann
Autor: Robert Noack

Im Rahmen der Qualifikationsarbeit sollen unter Verwendung von OCR-Koordinaten und Cluster-Verfahren Textabschnitte in Briefköpfen wie Absender, Adressat, Datum und Betreff erkannt werden und daraus mit einem lexikalischen Ansatz Personennamen, …

Vergleichende Analyse von Zeitreihen auf der Basis von Worthäufigkeiten der Wörter des Tages 2009 bis 2014

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Marcel Kisilowski

Logfileanalyse facettenbasierter IR-Systeme

Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Autor: Alexander Hellwig

Mit dem Virtual Language Observatory (VLO, http://catalog.clarin.eu/vlo/) stellt die Forschungsinfrastruktur CLARIN-D eine Suchmaschine für linguistische Metadaten zur Verfügung die sowohl Volltextsuche als auch facettierte Suche erlaubt. Im Rahmen …

Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart | Dr.-Ing. Christoph Kuras
Autor: Linda Gräßler

Im Rahmen des Projektes CLARIN-D werden u.a. verteilte Suchverfahren für Anfragen auf digitale Textressourcen implementiert (“Federated Content Search”, http://weblicht.sfs.uni-tuebingen.de/Aggregator/).
Ziel der Arbeit ist die Entwicklung (oder …

Aufbereitung von Texten in vereinfachtem und traditionellem Chinesisch - Evaluierung bestehende Verfahren für Tokenisierung und POS-Tagging


Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart

Performance-Analyse der Webcorpus-Toolchain auf dem HPC-System Taurus

Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Felix Brei

Semantische Keyword/Begriffslisten Extraktion aus Forschungsberichten und passende Anwendungen

Masterarbeit
Betreuer: Dr. Andreas Niekler

Keywords können aus Texten durch unterschiedliche Strategien extrahiert werden. Über Kookkurrenzen können die Keywords einen Textes ergänzt und erweitert werden. Zusätzlich können manuell gepflegte Keyword Listen genutzt werden, um die Daten …

Anwendung von Constrained Multi Label Textklassifikation in Wissensgraphen (Mit mehr Komplexität gerne auch als Masterarbeit)

Bachelorarbeit
Betreuer: Janos Borst | Dr. Andreas Niekler

Mit Graph-basierten Datenstrukturen kann jedem Dokument ein eindeutiger Bedeutungsbezug zugordnet werden. Dieser Bedeutungsbezug zeigt eine Abhängigkeit mehrerer Dateneigenschaften. Gehört ein Dokument zu einem Fachgebiet A, so kann es nicht …

Retrieval Performanz im Amazon Alexa Skill zur Flugsuche

Bachelorarbeit
Betreuer: Dr. Andreas Niekler