Abgeschlossene Arbeiten
2022
Bachelor- und Masterarbeiten im Infrastrukturprojekt Text+
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Erik Körner | Felix Helfer | Dr. Thomas Eckart
Text+ ist ein Konsortium der bundesweiten Initiative zum Aufbau einer nationalen Forschungsdateninfrastruktur (NFDI). Die Text+ Infrastruktur ist auf Sprach- und Textdaten ausgerichtet und konzentriert sich zunächst auf digitale Sammlungen, …
2020
Design moderner mobiler Wörterbuch-Anwendungen am Beispiel der Bantusprachen
Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
2013
Erstellung eines Lehrkonzepts für den Einsatz des Programms Rapid Miner in den Vorlesungen Text Mining und Linguistische Informatik
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Andreas Niekler
Autor: Alexander Lust
In den Vorlesungen Linguistische Informatik und Text Mining soll die Data Mining Software Rapid Miner für die Lehre eingesetzt werden. Dafür müssen 2 Vorlesungen, 10 Lehreinheiten (RapidMiner) und 10 Übungen (RapidMiner) erstellt werden.
Die …
2012
Integration von Daten der Semantic Web/Linked Data-Community in ISOcat/RELcat
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart | Volker Boehlke
Autor: Dr. Jochen Tiepmar
2011
SimpleDB als Backend für Topic Maps Engines
Bachelorarbeit
Betreuer: Benjamin Bock | Jun.-Prof. Lutz Maicher
Autor: Hans-Henning Koch
Amazon SimpleDB (Ψ) ist ein Webservice, der die Grundfunktionalitäten einer Datenbank (Abfragen und Indexierung) zur Verfügung stellt. Der Service arbeitet eng mit dem Amazon Simple Storage Service (Amazon S3) und …
2010
Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Benjamin Bock
Autor: Sven Windisch
Aspekte der Automatisierung der Schlagwortvergabe am Beispiel des Libri-Produktkatalogs
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Antje Schlaf
Phrasenbasierte Stimmungsanalyse
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Robert Remus
Datenintegration heterogener Quellen im Kontext der eHumanities
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Autor: David Pansch
Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps)
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Jan Werrmann
Im Rahmen eines Projektes wird überprüft, inwiefern Forentexte zu einer fachspezifischen Qualitätsanalyse beitragen können. Dazu werden aus bestimmten Automobilforen relevante Informationen extrahiert. Aus diesen wird eine Dokumentenkollektion …
2009
Finding and Analyzing Social Networks in unstructured web log data using probabilistic topic modeling
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Patrick Jähnichen
Externe Masterarbeit am Max-Planck-Institut für Evolutionäre Anthropologie. Betreuer am MPI war Colin Bannard.
Textvervollständigung auf antiken Texten
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
In Zeiten ständig wachsender Textmengen (bspw. Internet) steigt auch die Menge des darin gespeicherten Wissens. Um dieses Wissen extrahieren zu können, müssen speziell bei nicht lektorierten Texten (bspw. Web) relativ starke Textkorrekturen …
Konzeption, Implementierung und Evaluation eines TMQL Parsers und Interpreters
Masterarbeit
Betreuer: Jun.-Prof. Lutz Maicher
Durch zunehmende Komplexität der Datenstrukturen, welche mit Topic Maps modelliert werden, gewinnen Anfragesprachen, ähnlich wie SQL im Bereich relationaler Datenbanken, zunehmend an Bedeutung. TMQL ist …
TMCL Editor
Diplomarbeit
Betreuer: Jun.-Prof. Lutz Maicher
Bisher existiert kein standardisierter Ansatz zur Schema- bzw. Ontologiebeschreibung in Topic Maps.
Mit TMCL ist eine entsprechende Schemasprache derzeit in der ISO-Standardisierung. …
Morphologische Analyse von antiken Texten im sprach-evolutionärem Wandel
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Christine Voigtländer
2008
Sentence Boundary Detection
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Konstantin Sveds
Textanalyse und Korrektur von durch OCR-Verfahren gewonnenem Text
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Sven Teresniak
Autor: Ying Xu
Entfernung von Fehlern in durch OCR-Verfahren gewonnenem Text mittels der Verfahren und Datenbestände der ASV.
Models of random text production for investigating repetition and reuse in language development
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Ronny Melz
Autor: Frank Binder
Externe Diplomarbeit am Max-Planck-Institut für Evolutionäre Anthropologie. Betreuer am MPI war Colin Bannard.
Konzeption und Realisierung eines multilingualen Systems zur Erkennung benannter Entitäten
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Daniel Trabold
Topic-Maps-Middleware. Modellgetriebene Entwicklung kombinierbarer domänenspezifischer Topic-Maps-Komponenten
Diplomarbeit
Autor: Benjamin Bock
Das Topic-Maps-Datenmodell (TMDM) ist (seit seines Bestehens) Grundlage für
Entwicklung von Topic-Maps-Engines. Eine Topic-Maps-Engine ist eine
Programmbibliothek, die über eine Programmierschnittstelle (API) die …
Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Beziehungen aus dem Datenbestand der Wikipedia
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Daniel Kinzler
REST-basierter, virtueller Topic aps-View für unstrukturierte Text-Korpora
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Daniel Zimmermann
Modellierung des Entscheidungsprozesses und Entwicklung eines Werkzeugs zur Unterstützung der Grammatikerstellung für Sprachdialogsysteme
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Oleg Tag
Reader’s News – die personalisierte Zeitung
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Stephan Hoyer
2007
Untersuchung zur Klassifizierung von Texten nach Autoren bzw. Zeitungen unter zu Hilfenahme von statistischen und anderen Mitteln
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Dominik Herold
Integration verbesserter Geodaten in den Wortschatz der Universität Leipzig
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Torsten Jolig
Chinesischer Wortschatz: Segmentierung, Erkennung von Organisationsnamen und Integrierung eines Wörterbuchs in die Korpus-Browser
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Bao Chun
Chinesischer Wortschatz: Textsammlung mit RSS. Textaufbereitung und statistische Analyse
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Bo Peng
Statistische Verfahren zur Ermittlung lokaler Ereignisse und damit verbundenen Personen aus Zeitungstexten am Beispiel berühmter Kriminalfälle
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Elke Klippstein
Syntaktische Analyse natürlicher Sprache unter Verwendung statistischer Kookkurenzanalyse
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Christian Hänig
Information-Retrieval in einem P2P-Netz mit Small-World-Eigenschaften -- Simulation und Evaluation des SemPIR-Modells
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Sven Teresniak
Nichtüberwachte Wörterbucherstellung aus quasiparallelem Text
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Andreas Pittelkau
Implementierung eines semantischen Taggers für die deutsche Sprache mit Hilfe eines Markov Modells
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Renfei Zang
Wortbedeutungsdisambiguierung mittels sprachunabhängiger, kookkurrenzbasierter Algorithmen
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sven Reuter
Extraktion von Redewendungen
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Christian Beutenmüller
Strategien, Konzepte und prototypische Entwicklung einer Software für die semiautomatische Analyse chronologischer Textmuster in Zeitscheibenkorpora
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Konzeption und Implementierung eines Topic-Maps-basierten Community-Portals
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Claudia Römer
Konzeption und Implementierung eines topic maps-basierten Community-Portals
Zum aktuellen Zeitpunkt existiert kein Community-Portal zum Thema Topic Maps-Technologien. Ein solches Online-Portal, soll Informationen zu relevanten Publikationen, …
Dokumenten-Clustering von tagesaktuellen Zeitungstexten auf der Grundlage der Wörter des Tages
Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Chun Cui
Klassifikation dynamischer Textströme – Eine Erweiterung der inhaltsbasierten Textkategorisierung
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Christian Sickert
Automatische Erstellung zweisprachiger Wörterbücher aus Paralleltexten – Ein sprachunabhängiger Ansatz
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Matthias Ongyerth
Automatische Extraktion von Termhierarchien aus Dokumentenkollektionen für die semantische Strukturierung
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Hans Friedrich Witschel
Autor: Florian Holz
2006
Automatic Extension of Semantic Lexicons with a Bootstrapping Algorithm
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Richard Socher
Schwierigkeiten bei der Anwendung vollständig-entscheidbarer Deduktionsalgorithmen auf reale Ontologien und deren Anwendung zur semantischen Analyse Englischer Texte
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Udo Stenzel
Data und Text Mining für das CRM am Beispiel ausgewählter Kundendaten
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Frank Schmiedbauer
Identifizierung und Entdeckung von Sprachen bei Texten des WWW durch Clustern der häufigsten Trigramme
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Antje Schlaf
Semantische Analyse der Linkstrukturen von Webseiten mit Hilfe von sprachstatistischen Methoden
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Peter Kurras
Ein Satzgenerator für das Deutsche und dessen Anwendung in der natürlichsprachlichen Ausgabe von Datenbankinhalten
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Mathias Rosenau
Architektur und Evaluation von Szenorien für die Integration von e-Learning Plattformen und Content Management Systemen
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Matthias Blenn
Flexibles Berechnen von Kookkurrenzen auf strukturierten und unstruktuierten Daten
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Marco Büchler
Extraktion semantischer Beziehungen aus natürlicher Sprache durch Nutzung sprachlichen Wissens aus der Kindersprache
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sandy Pleißner
Text Mining for Quality and Service
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Christian Lehmann
Clustering und Klassifikation von Personennamen
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Robert Lokaiczyk
Kontextsensitive und domänenspezifische Rechtschreibekorrektur durch Einsatz von Work-Assoziationen
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Rolf Sabsch
2005
Webbasierte Editierwerkzeug zum Wortschatz-Wörterbuch mit linguistischer Unterstützung
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Andreas Fritzsche
Textminingverfahren zur Ermittlung von Webseiten mit Stellenangeboten auf linguistisch-statistischer Basis
Diplomarbeit
Autor: Christian Lehmann
Angewandte Situationstheorie: Gewinnung von Informationen aus Text und Möglichkeiten der Verwendung
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Nicki Klett
Untersuchung sprachunabhängiger statistischer Verfahren für die Übersetzung von Fachbegriffen zur Unterstützung des Verstehens fremdsprachlicher Texte
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Lars Wachsmuth
Statistikbasierte Sprachidentifikation auf Satzbasis
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sven Teresniak
Korpussuchmaschine mit Berücksichtigung linguistischer Merkmale wie Flexion und Wortklasse
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Marcel Anacker
Konzeptionelle Zooms auf semantischen Netzen
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Martin Christian
Evaluation und Verknüpfung von Kookkurrenzen höherer Ordnung und Probabilistic Latent Semantic Analysis
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Marek Mahn
Vergleich von Verfahren zur Ermittlung des semantischen Ähnlichkeit von Websites auf Basis von Termvektoren und Linkstruktur
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Sebastian Buntin
2004
Text, Wörter, Mophene – Möglichkeiten einer automatischen Terminologieextraktion
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Dr. Hans Friedrich Witschel
Extraktion von Textelementen mittels „spreading activation“ für indikative Textzusammenfassungen
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff
Autor: Michael Barth
Optimierung von Suchmechanismen in webbasierten eGovernment-Anwendungen anhand des Einsatzes von Methoden der Automatischen Sprachverarbeitung
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer
Autor: Patrick Mairif
Jahr nicht angegeben
PSI-Repository für linked Topic Maps
Masterarbeit
Betreuer: Benjamin Bock | Jun.-Prof. Lutz Maicher
Die konsistente Nutzung von Gegenstandsanzeigern (PSI, Ψ, subject identifier) ist die Grundlage für die semantische Interoperabilität in Topic Maps. Immer dann, wenn zwei Topics identische PSIs nutzen, werden sie zusammengeführt. Temporal und …
Bachelor- und Masterarbeiten im Infrastrukturprojekt CLARIN-D
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
CLARIN-D ist eine auf Metadaten basierende Forschungsinfrastruktur für Geistes- und Sozialwissenschaften. Für die textorientierten Geisteswissenschaften sind interaktive Text-Analyse- und Annotations-Verfahren für typische eHumanities Anwendungen …
Limbic Maps als Klassifikationsgrundlage
Implementierung eines Morphologieanalysesystems
Automatische Wörterbucherstellung mittels Trans-Kookkurrenzen aus dem JRC-Acquis
Diplomarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Yan Wu
Graphische Visualisierung von Korpusdaten am Beispiel von Parallelkoordinaten
Masterarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Sergej Vintgolc
Evaluierung von Hadoop und MapReduce-Algorithmen für ökonometrische Clusteranalysen
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Jun.-Prof. Lutz Maicher
Big data wird zunehmend in der ökonomischen Forschung wichtig. In dieser Arbeit sollen in Kooperation mit dem Fraunhofer MOEZ die Möglichkeit skalierbarer Verfahren für ökonometrische Clusteranalysen an einem konkreten Beispiel evaluiert werden. …
Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Sebastian Sander
Termextraktion auf antiken Texten
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Datenintegration heterogener Quellen im Kontext der eHumanities
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: David Pansch
Mental Maps: Aufbau von orts- und zeitabhängigen Bedeutungsräumen zum automatischen Erkennen politischer und gesellschaftlicher Zäsuren im historischen Kontext
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: David Stange
Local Text Reuse Detection mittels Diskreter Kosinustransformation auf Grafik-Hardware
Diplomarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Fragmentarische Autoren - Extraktion altgriechischer Eigennamen und Belegstellen auf Antiken Texten
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Maria Moritz
Visualisierung von Kookkurrenzgraphen
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Marco Büchler
Autor: Frederik Baumgardt
Multi-Label Klassifikation am Beispiel der sozialwissenschaftlicher Texte
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Jochen (*) Tiepmar
Autor: Nathanael Philipp
(im Rahmen des Projektvorhabens „Postdemokratie“, verbunden mit einer SHK-Stelle)
In einer umfassenden Dissertation (Scharkov 2012) wurden verschiedene Klassifikationsverfahren für ihre Eignung in den Sozialwissenschaften und der Medienanalyse …
Auswertung von Briefköpfen für die Dokumentklassifikation
Masterarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Daniel Isemann
Autor: Robert Noack
Im Rahmen der Qualifikationsarbeit sollen unter Verwendung von OCR-Koordinaten und Cluster-Verfahren Textabschnitte in Briefköpfen wie Absender, Adressat, Datum und Betreff erkannt werden und daraus mit einem lexikalischen Ansatz Personennamen, …
Vergleichende Analyse von Zeitreihen auf der Basis von Worthäufigkeiten der Wörter des Tages 2009 bis 2014
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Marcel Kisilowski
Logfileanalyse facettenbasierter IR-Systeme
Bachelorarbeit
Betreuer: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Autor: Alexander Hellwig
Mit dem Virtual Language Observatory (VLO, http://catalog.clarin.eu/vlo/) stellt die Forschungsinfrastruktur CLARIN-D eine Suchmaschine für linguistische Metadaten zur Verfügung die sowohl Volltextsuche als auch facettierte Suche erlaubt. Im Rahmen …
Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart | Dr.-Ing. Christoph Kuras
Autor: Linda Gräßler
Im Rahmen des Projektes CLARIN-D werden u.a. verteilte Suchverfahren für Anfragen auf digitale Textressourcen implementiert (“Federated Content Search”, http://weblicht.sfs.uni-tuebingen.de/Aggregator/).
Ziel der Arbeit ist die Entwicklung (oder …
Aufbereitung von Texten in vereinfachtem und traditionellem Chinesisch - Evaluierung bestehende Verfahren für Tokenisierung und POS-Tagging
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Performance-Analyse der Webcorpus-Toolchain auf dem HPC-System Taurus
Bachelorarbeit
Betreuer: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Autor: Felix Brei
Semantische Keyword/Begriffslisten Extraktion aus Forschungsberichten und passende Anwendungen
Masterarbeit
Betreuer: Dr. Andreas Niekler
Keywords können aus Texten durch unterschiedliche Strategien extrahiert werden. Über Kookkurrenzen können die Keywords einen Textes ergänzt und erweitert werden. Zusätzlich können manuell gepflegte Keyword Listen genutzt werden, um die Daten …
Anwendung von Constrained Multi Label Textklassifikation in Wissensgraphen (Mit mehr Komplexität gerne auch als Masterarbeit)
Bachelorarbeit
Betreuer: Janos Borst | Dr. Andreas Niekler
Mit Graph-basierten Datenstrukturen kann jedem Dokument ein eindeutiger Bedeutungsbezug zugordnet werden. Dieser Bedeutungsbezug zeigt eine Abhängigkeit mehrerer Dateneigenschaften. Gehört ein Dokument zu einem Fachgebiet A, so kann es nicht …
Retrieval Performanz im Amazon Alexa Skill zur Flugsuche
Bachelorarbeit
Betreuer: Dr. Andreas Niekler