Finished Theses
2022
Bachelor- und Masterarbeiten im Infrastrukturprojekt Text+
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Erik Körner | Felix Helfer | Dr. Thomas Eckart
Text+ ist ein Konsortium der bundesweiten Initiative zum Aufbau einer nationalen Forschungsdateninfrastruktur (NFDI). Die Text+ Infrastruktur ist auf Sprach- und Textdaten ausgerichtet und konzentriert sich zunächst auf digitale Sammlungen, …
2020
Design moderner mobiler Wörterbuch-Anwendungen am Beispiel der Bantusprachen
Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
2013
Erstellung eines Lehrkonzepts für den Einsatz des Programms Rapid Miner in den Vorlesungen Text Mining und Linguistische Informatik
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Andreas Niekler
Author: Alexander Lust
In den Vorlesungen Linguistische Informatik und Text Mining soll die Data Mining Software Rapid Miner für die Lehre eingesetzt werden. Dafür müssen 2 Vorlesungen, 10 Lehreinheiten (RapidMiner) und 10 Übungen (RapidMiner) erstellt werden.
Die …
2012
Integration von Daten der Semantic Web/Linked Data-Community in ISOcat/RELcat
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart | Volker Boehlke
Author: Dr. Jochen Tiepmar
2011
SimpleDB als Backend für Topic Maps Engines
Bachelorarbeit
Advisor: Benjamin Bock | Jun.-Prof. Lutz Maicher
Author: Hans-Henning Koch
Amazon SimpleDB (Ψ) ist ein Webservice, der die Grundfunktionalitäten einer Datenbank (Abfragen und Indexierung) zur Verfügung stellt. Der Service arbeitet eng mit dem Amazon Simple Storage Service (Amazon S3) und …
2010
Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Benjamin Bock
Author: Sven Windisch
Aspekte der Automatisierung der Schlagwortvergabe am Beispiel des Libri-Produktkatalogs
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Antje Schlaf
Phrasenbasierte Stimmungsanalyse
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Robert Remus
Datenintegration heterogener Quellen im Kontext der eHumanities
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Author: David Pansch
Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps)
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Jan Werrmann
Im Rahmen eines Projektes wird überprüft, inwiefern Forentexte zu einer fachspezifischen Qualitätsanalyse beitragen können. Dazu werden aus bestimmten Automobilforen relevante Informationen extrahiert. Aus diesen wird eine Dokumentenkollektion …
2009
Finding and Analyzing Social Networks in unstructured web log data using probabilistic topic modeling
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Patrick Jähnichen
External Masterthesis in corporation with Max-Planck-Institut for Evolutionary Anthropology. Supervisor at MPI was Colin Bannard.
Textvervollständigung auf antiken Texten
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
In Zeiten ständig wachsender Textmengen (bspw. Internet) steigt auch die Menge des darin gespeicherten Wissens. Um dieses Wissen extrahieren zu können, müssen speziell bei nicht lektorierten Texten (bspw. Web) relativ starke Textkorrekturen …
Konzeption, Implementierung und Evaluation eines TMQL Parsers und Interpreters
Masterarbeit
Advisor: Jun.-Prof. Lutz Maicher
Durch zunehmende Komplexität der Datenstrukturen, welche mit Topic Maps modelliert werden, gewinnen Anfragesprachen, ähnlich wie SQL im Bereich relationaler Datenbanken, zunehmend an Bedeutung. TMQL ist …
TMCL Editor
Diplomarbeit
Advisor: Jun.-Prof. Lutz Maicher
Bisher existiert kein standardisierter Ansatz zur Schema- bzw. Ontologiebeschreibung in Topic Maps.
Mit TMCL ist eine entsprechende Schemasprache derzeit in der ISO-Standardisierung. …
Morphologische Analyse von antiken Texten im sprach-evolutionärem Wandel
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Christine Voigtländer
2008
Sentence Boundary Detection
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Konstantin Sveds
Textanalyse und Korrektur von durch OCR-Verfahren gewonnenem Text
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Sven Teresniak
Author: Ying Xu
Entfernung von Fehlern in durch OCR-Verfahren gewonnenem Text mittels der Verfahren und Datenbestände der ASV.
Models of random text production for investigating repetition and reuse in language development
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Ronny Melz
Author: Frank Binder
This thesis was done external at the Max Planck Institute for Evolutionary Anthropology. The MPI-Advisor was Colin Bannard.
Konzeption und Realisierung eines multilingualen Systems zur Erkennung benannter Entitäten
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Daniel Trabold
Topic Maps Middleware. Model-driven Development of combinable domain-specific Topic Maps Components
Diplomarbeit
Author: Benjamin Bock
In this thesis, the outdated Topic Maps API
TMAPI 1.0 is adapted to the TMDM. It is restructured and extended with the goal
of improved usability. This work formalizes the TMDM using a domain …
Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Beziehungen aus dem Datenbestand der Wikipedia
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Daniel Kinzler
REST-basierter, virtueller Topic aps-View für unstrukturierte Text-Korpora
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Daniel Zimmermann
Modellierung des Entscheidungsprozesses und Entwicklung eines Werkzeugs zur Unterstützung der Grammatikerstellung für Sprachdialogsysteme
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Oleg Tag
Reader’s News – die personalisierte Zeitung
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Stephan Hoyer
2007
Untersuchung zur Klassifizierung von Texten nach Autoren bzw. Zeitungen unter zu Hilfenahme von statistischen und anderen Mitteln
Advisor: Prof. Dr. Uwe Quasthoff
Author: Dominik Herold
Integration verbesserter Geodaten in den Wortschatz der Universität Leipzig
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Torsten Jolig
Chinesischer Wortschatz: Segmentierung, Erkennung von Organisationsnamen und Integrierung eines Wörterbuchs in die Korpus-Browser
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Bao Chun
Chinesischer Wortschatz: Textsammlung mit RSS. Textaufbereitung und statistische Analyse
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Bo Peng
Statistische Verfahren zur Ermittlung lokaler Ereignisse und damit verbundenen Personen aus Zeitungstexten am Beispiel berühmter Kriminalfälle
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Elke Klippstein
Syntaktische Analyse natürlicher Sprache unter Verwendung statistischer Kookkurenzanalyse
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Christian Hänig
Information-Retrieval in einem P2P-Netz mit Small-World-Eigenschaften -- Simulation und Evaluation des SemPIR-Modells
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Sven Teresniak
Nichtüberwachte Wörterbucherstellung aus quasiparallelem Text
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Andreas Pittelkau
Implementierung eines semantischen Taggers für die deutsche Sprache mit Hilfe eines Markov Modells
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Renfei Zang
Wortbedeutungsdisambiguierung mittels sprachunabhängiger, kookkurrenzbasierter Algorithmen
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sven Reuter
Extraktion von Redewendungen
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Christian Beutenmüller
Strategien, Konzepte und prototypische Entwicklung einer Software für die semiautomatische Analyse chronologischer Textmuster in Zeitscheibenkorpora
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Konzeption und Implementierung eines Topic-Maps-basierten Community-Portals
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Claudia Römer
Konzeption und Implementierung eines topic maps-basierten Community-Portals
Zum aktuellen Zeitpunkt existiert kein Community-Portal zum Thema Topic Maps-Technologien. Ein solches Online-Portal, soll Informationen zu relevanten Publikationen, …
Dokumenten-Clustering von tagesaktuellen Zeitungstexten auf der Grundlage der Wörter des Tages
Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Chun Cui
Klassifikation dynamischer Textströme – Eine Erweiterung der inhaltsbasierten Textkategorisierung
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Christian Sickert
Automatische Erstellung zweisprachiger Wörterbücher aus Paralleltexten – Ein sprachunabhängiger Ansatz
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Matthias Ongyerth
Automatische Extraktion von Termhierarchien aus Dokumentenkollektionen für die semantische Strukturierung (Extraction of Term Hierarchies for the Semantic Structuring of Document Collections)
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Hans Friedrich Witschel
Author: Florian Holz
2006
Automatic Extension of Semantic Lexicons with a Bootstrapping Algorithm
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Richard Socher
Schwierigkeiten bei der Anwendung vollständig-entscheidbarer Deduktionsalgorithmen auf reale Ontologien und deren Anwendung zur semantischen Analyse Englischer Texte
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Udo Stenzel
Data und Text Mining für das CRM am Beispiel ausgewählter Kundendaten
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Frank Schmiedbauer
Identifizierung und Entdeckung von Sprachen bei Texten des WWW durch Clustern der häufigsten Trigramme
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Antje Schlaf
Semantische Analyse der Linkstrukturen von Webseiten mit Hilfe von sprachstatistischen Methoden
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Peter Kurras
Ein Satzgenerator für das Deutsche und dessen Anwendung in der natürlichsprachlichen Ausgabe von Datenbankinhalten
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Mathias Rosenau
Architektur und Evaluation von Szenorien für die Integration von e-Learning Plattformen und Content Management Systemen
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Matthias Blenn
Flexibles Berechnen von Kookkurrenzen auf strukturierten und unstruktuierten Daten
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Marco Büchler
Extraktion semantischer Beziehungen aus natürlicher Sprache durch Nutzung sprachlichen Wissens aus der Kindersprache
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sandy Pleißner
Text Mining for Quality and Service
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Christian Lehmann
Clustering und Klassifikation von Personennamen
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Robert Lokaiczyk
Kontextsensitive und domänenspezifische Rechtschreibekorrektur durch Einsatz von Work-Assoziationen
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Rolf Sabsch
2005
Webbasierte Editierwerkzeug zum Wortschatz-Wörterbuch mit linguistischer Unterstützung
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Andreas Fritzsche
Textminingverfahren zur Ermittlung von Webseiten mit Stellenangeboten auf linguistisch-statistischer Basis
Diplomarbeit
Author: Christian Lehmann
Angewandte Situationstheorie: Gewinnung von Informationen aus Text und Möglichkeiten der Verwendung
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Nicki Klett
Untersuchung sprachunabhängiger statistischer Verfahren für die Übersetzung von Fachbegriffen zur Unterstützung des Verstehens fremdsprachlicher Texte
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Lars Wachsmuth
Statistikbasierte Sprachidentifikation auf Satzbasis
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sven Teresniak
Korpussuchmaschine mit Berücksichtigung linguistischer Merkmale wie Flexion und Wortklasse
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Marcel Anacker
Konzeptionelle Zooms auf semantischen Netzen
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Martin Christian
Evaluation und Verknüpfung von Kookkurrenzen höherer Ordnung und Probabilistic Latent Semantic Analysis
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Marek Mahn
Vergleich von Verfahren zur Ermittlung des semantischen Ähnlichkeit von Websites auf Basis von Termvektoren und Linkstruktur
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sebastian Buntin
2004
Text, Wörter, Mophene – Möglichkeiten einer automatischen Terminologieextraktion
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Dr. Hans Friedrich Witschel
Extraktion von Textelementen mittels „spreading activation“ für indikative Textzusammenfassungen
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Michael Barth
Optimierung von Suchmechanismen in webbasierten eGovernment-Anwendungen anhand des Einsatzes von Methoden der Automatischen Sprachverarbeitung
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Patrick Mairif
no year given
PSI-Repository für _linked_ Topic Maps
Masterarbeit
Advisor: Benjamin Bock | Jun.-Prof. Lutz Maicher
Die konsistente Nutzung von Gegenstandsanzeigern (PSI, Ψ, subject identifier) ist die Grundlage für die semantische Interoperabilität in Topic Maps. Immer dann, wenn zwei Topics identische PSIs nutzen, werden sie zusammengeführt. Temporal und …
Bachelor- und Masterarbeiten im Infrastrukturprojekt CLARIN-D
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
CLARIN-D ist eine auf Metadaten basierende Forschungsinfrastruktur für Geistes- und Sozialwissenschaften. Für die textorientierten Geisteswissenschaften sind interaktive Text-Analyse- und Annotations-Verfahren für typische eHumanities Anwendungen …
Limbic Maps als Klassifikationsgrundlage
Implementierung eines Morphologieanalysesystems
Automatische Wörterbucherstellung mittels Trans-Kookkurrenzen aus dem JRC-Acquis
Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Yan Wu
Graphische Visualisierung von Korpusdaten am Beispiel von Parallelkoordinaten
Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Sergej Vintgolc
Evaluierung von Hadoop und MapReduce-Algorithmen für ökonometrische Clusteranalysen
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Jun.-Prof. Lutz Maicher
Big data wird zunehmend in der ökonomischen Forschung wichtig. In dieser Arbeit sollen in Kooperation mit dem Fraunhofer MOEZ die Möglichkeit skalierbarer Verfahren für ökonometrische Clusteranalysen an einem konkreten Beispiel evaluiert werden. …
Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Sebastian Sander
Termextraktion auf antiken Texten
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Datenintegration heterogener Quellen im Kontext der eHumanities
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: David Pansch
Mental Maps: Aufbau von orts- und zeitabhängigen Bedeutungsräumen zum automatischen Erkennen politischer und gesellschaftlicher Zäsuren im historischen Kontext
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: David Stange
Local Text Reuse Detection mittels Diskreter Kosinustransformation auf Grafik-Hardware
Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Fragmentarische Autoren - Extraktion altgriechischer Eigennamen und Belegstellen auf Antiken Texten
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Maria Moritz
Visualisierung von Kookkurrenzgraphen
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Frederik Baumgardt
Multi-Label Klassifikation am Beispiel der sozialwissenschaftlicher Texte
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Jochen (*) Tiepmar
Author: Nathanael Philipp
(im Rahmen des Projektvorhabens „Postdemokratie“, verbunden mit einer SHK-Stelle)
In einer umfassenden Dissertation (Scharkov 2012) wurden verschiedene Klassifikationsverfahren für ihre Eignung in den Sozialwissenschaften und der Medienanalyse …
Auswertung von Briefköpfen für die Dokumentklassifikation
Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Daniel Isemann
Author: Robert Noack
Im Rahmen der Qualifikationsarbeit sollen unter Verwendung von OCR-Koordinaten und Cluster-Verfahren Textabschnitte in Briefköpfen wie Absender, Adressat, Datum und Betreff erkannt werden und daraus mit einem lexikalischen Ansatz Personennamen, …
Vergleichende Analyse von Zeitreihen auf der Basis von Worthäufigkeiten der Wörter des Tages 2009 bis 2014
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Marcel Kisilowski
Logfileanalyse facettenbasierter IR-Systeme
Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Author: Alexander Hellwig
Mit dem Virtual Language Observatory (VLO, http://catalog.clarin.eu/vlo/) stellt die Forschungsinfrastruktur CLARIN-D eine Suchmaschine für linguistische Metadaten zur Verfügung die sowohl Volltextsuche als auch facettierte Suche erlaubt. Im Rahmen …
Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart | Dr.-Ing. Christoph Kuras
Author: Linda Gräßler
Im Rahmen des Projektes CLARIN-D werden u.a. verteilte Suchverfahren für Anfragen auf digitale Textressourcen implementiert (“Federated Content Search”, http://weblicht.sfs.uni-tuebingen.de/Aggregator/).
Ziel der Arbeit ist die Entwicklung (oder …
Aufbereitung von Texten in vereinfachtem und traditionellem Chinesisch - Evaluierung bestehende Verfahren für Tokenisierung und POS-Tagging
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Performance-Analyse der Webcorpus-Toolchain auf dem HPC-System Taurus
Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Felix Brei
Semantische Keyword/Begriffslisten Extraktion aus Forschungsberichten und passende Anwendungen
Masterarbeit
Advisor: Dr. Andreas Niekler
Keywords können aus Texten durch unterschiedliche Strategien extrahiert werden. Über Kookkurrenzen können die Keywords einen Textes ergänzt und erweitert werden. Zusätzlich können manuell gepflegte Keyword Listen genutzt werden, um die Daten …
Anwendung von Constrained Multi Label Textklassifikation in Wissensgraphen (Mit mehr Komplexität gerne auch als Masterarbeit)
Bachelorarbeit
Advisor: Janos Borst | Dr. Andreas Niekler
Mit Graph-basierten Datenstrukturen kann jedem Dokument ein eindeutiger Bedeutungsbezug zugordnet werden. Dieser Bedeutungsbezug zeigt eine Abhängigkeit mehrerer Dateneigenschaften. Gehört ein Dokument zu einem Fachgebiet A, so kann es nicht …
Retrieval Performanz im Amazon Alexa Skill zur Flugsuche
Bachelorarbeit
Advisor: Dr. Andreas Niekler