Dies ist die archivierte Webseite der ASV. Aktuellere Informationen finden Sie unter temir.org und über die Suchfunktion auf uni-leipzig.de
ASV-Label
Login

16px-feed-icon Theses Diese Seite auf deutsch anzeigen

Finished Theses

2022

Bachelor- und Masterarbeiten im Infrastrukturprojekt Text+

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Erik Körner | Felix Helfer | Dr. Thomas Eckart

Text+ ist ein Konsortium der bundesweiten Initiative zum Aufbau einer nationalen Forschungsdateninfrastruktur (NFDI). Die Text+ Infrastruktur ist auf Sprach- und Textdaten ausgerichtet und konzentriert sich zunächst auf digitale Sammlungen, …

2020

Design moderner mobiler Wörterbuch-Anwendungen am Beispiel der Bantusprachen

Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart

2013

Erstellung eines Lehrkonzepts für den Einsatz des Programms Rapid Miner in den Vorlesungen Text Mining und Linguistische Informatik

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Andreas Niekler
Author: Alexander Lust

In den Vorlesungen Linguistische Informatik und Text Mining soll die Data Mining Software Rapid Miner für die Lehre eingesetzt werden. Dafür müssen 2 Vorlesungen, 10 Lehreinheiten (RapidMiner) und 10 Übungen (RapidMiner) erstellt werden.
Die …

2012

Integration von Daten der Semantic Web/Linked Data-Community in ISOcat/RELcat

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart | Volker Boehlke
Author: Dr. Jochen Tiepmar

2011

SimpleDB als Backend für Topic Maps Engines

Bachelorarbeit
Advisor: Benjamin Bock | Jun.-Prof. Lutz Maicher
Author: Hans-Henning Koch

Amazon SimpleDB (Ψ) ist ein Webservice, der die Grundfunktionalitäten einer Datenbank (Abfragen und Indexierung) zur Verfügung stellt. Der Service arbeitet eng mit dem Amazon Simple Storage Service (Amazon S3) und …

2010

Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Benjamin Bock
Author: Sven Windisch

Aspekte der Automatisierung der Schlagwortvergabe am Beispiel des Libri-Produktkatalogs

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Antje Schlaf

Phrasenbasierte Stimmungsanalyse

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Robert Remus

Datenintegration heterogener Quellen im Kontext der eHumanities

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Author: David Pansch

Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps)

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Jan Werrmann

Im Rahmen eines Projektes wird überprüft, inwiefern Forentexte zu einer fachspezifischen Qualitätsanalyse beitragen können. Dazu werden aus bestimmten Automobilforen relevante Informationen extrahiert. Aus diesen wird eine Dokumentenkollektion …

2009

Finding and Analyzing Social Networks in unstructured web log data using probabilistic topic modeling

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Patrick Jähnichen

External Masterthesis in corporation with Max-Planck-Institut for Evolutionary Anthropology. Supervisor at MPI was Colin Bannard.

Textvervollständigung auf antiken Texten

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler

In Zeiten ständig wachsender Textmengen (bspw. Internet) steigt auch die Menge des darin gespeicherten Wissens. Um dieses Wissen extrahieren zu können, müssen speziell bei nicht lektorierten Texten (bspw. Web) relativ starke Textkorrekturen …

Konzeption, Implementierung und Evaluation eines TMQL Parsers und Interpreters

Masterarbeit
Advisor: Jun.-Prof. Lutz Maicher

Durch zunehmende Komplexität der Datenstrukturen, welche mit Topic Maps modelliert werden, gewinnen Anfragesprachen, ähnlich wie SQL im Bereich relationaler Datenbanken, zunehmend an Bedeutung. TMQL ist …

TMCL Editor

Diplomarbeit
Advisor: Jun.-Prof. Lutz Maicher

Bisher existiert kein standardisierter Ansatz zur Schema- bzw. Ontologiebeschreibung in Topic Maps.

Mit TMCL ist eine entsprechende Schemasprache derzeit in der ISO-Standardisierung. …

Morphologische Analyse von antiken Texten im sprach-evolutionärem Wandel

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Christine Voigtländer

2008

Sentence Boundary Detection

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Konstantin Sveds

Textanalyse und Korrektur von durch OCR-Verfahren gewonnenem Text

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Sven Teresniak
Author: Ying Xu

Entfernung von Fehlern in durch OCR-Verfahren gewonnenem Text mittels der Verfahren und Datenbestände der ASV.

Models of random text production for investigating repetition and reuse in language development

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Ronny Melz
Author: Frank Binder

This thesis was done external at the Max Planck Institute for Evolutionary Anthropology. The MPI-Advisor was Colin Bannard.

Konzeption und Realisierung eines multilingualen Systems zur Erkennung benannter Entitäten

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Daniel Trabold

Topic Maps Middleware. Model-driven Development of combinable domain-specific Topic Maps Components

Diplomarbeit
Author: Benjamin Bock

In this thesis, the outdated Topic Maps API
TMAPI 1.0 is adapted to the TMDM. It is restructured and extended with the goal
of improved usability. This work formalizes the TMDM using a domain …

Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Beziehungen aus dem Datenbestand der Wikipedia

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Daniel Kinzler

REST-basierter, virtueller Topic aps-View für unstrukturierte Text-Korpora

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Daniel Zimmermann

Modellierung des Entscheidungsprozesses und Entwicklung eines Werkzeugs zur Unterstützung der Grammatikerstellung für Sprachdialogsysteme

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Oleg Tag

Reader’s News – die personalisierte Zeitung

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Stephan Hoyer

2007

Untersuchung zur Klassifizierung von Texten nach Autoren bzw. Zeitungen unter zu Hilfenahme von statistischen und anderen Mitteln


Advisor: Prof. Dr. Uwe Quasthoff
Author: Dominik Herold

Integration verbesserter Geodaten in den Wortschatz der Universität Leipzig

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Torsten Jolig

Chinesischer Wortschatz: Segmentierung, Erkennung von Organisationsnamen und Integrierung eines Wörterbuchs in die Korpus-Browser

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Bao Chun

Chinesischer Wortschatz: Textsammlung mit RSS. Textaufbereitung und statistische Analyse

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Bo Peng

Statistische Verfahren zur Ermittlung lokaler Ereignisse und damit verbundenen Personen aus Zeitungstexten am Beispiel berühmter Kriminalfälle

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Elke Klippstein

Syntaktische Analyse natürlicher Sprache unter Verwendung statistischer Kookkurenzanalyse

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Christian Hänig

Information-Retrieval in einem P2P-Netz mit Small-World-Eigenschaften -- Simulation und Evaluation des SemPIR-Modells

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Sven Teresniak

Nichtüberwachte Wörterbucherstellung aus quasiparallelem Text

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Andreas Pittelkau

Implementierung eines semantischen Taggers für die deutsche Sprache mit Hilfe eines Markov Modells

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Renfei Zang

Wortbedeutungsdisambiguierung mittels sprachunabhängiger, kookkurrenzbasierter Algorithmen

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sven Reuter

Extraktion von Redewendungen

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Christian Beutenmüller

Strategien, Konzepte und prototypische Entwicklung einer Software für die semiautomatische Analyse chronologischer Textmuster in Zeitscheibenkorpora

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer

Konzeption und Implementierung eines Topic-Maps-basierten Community-Portals

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Claudia Römer

Konzeption und Implementierung eines topic maps-basierten Community-Portals

Zum aktuellen Zeitpunkt existiert kein Community-Portal zum Thema Topic Maps-Technologien. Ein solches Online-Portal, soll Informationen zu relevanten Publikationen, …

Dokumenten-Clustering von tagesaktuellen Zeitungstexten auf der Grundlage der Wörter des Tages

Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Chun Cui

Klassifikation dynamischer Textströme – Eine Erweiterung der inhaltsbasierten Textkategorisierung

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Christian Sickert

Automatische Erstellung zweisprachiger Wörterbücher aus Paralleltexten – Ein sprachunabhängiger Ansatz

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Matthias Ongyerth

Automatische Extraktion von Termhierarchien aus Dokumentenkollektionen für die semantische Strukturierung (Extraction of Term Hierarchies for the Semantic Structuring of Document Collections)

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Hans Friedrich Witschel
Author: Florian Holz

2006

Automatic Extension of Semantic Lexicons with a Bootstrapping Algorithm

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Richard Socher

Schwierigkeiten bei der Anwendung vollständig-entscheidbarer Deduktionsalgorithmen auf reale Ontologien und deren Anwendung zur semantischen Analyse Englischer Texte

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Udo Stenzel

Data und Text Mining für das CRM am Beispiel ausgewählter Kundendaten

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Frank Schmiedbauer

Identifizierung und Entdeckung von Sprachen bei Texten des WWW durch Clustern der häufigsten Trigramme

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Antje Schlaf

Semantische Analyse der Linkstrukturen von Webseiten mit Hilfe von sprachstatistischen Methoden

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Peter Kurras

Ein Satzgenerator für das Deutsche und dessen Anwendung in der natürlichsprachlichen Ausgabe von Datenbankinhalten

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Mathias Rosenau

Architektur und Evaluation von Szenorien für die Integration von e-Learning Plattformen und Content Management Systemen

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Matthias Blenn

Flexibles Berechnen von Kookkurrenzen auf strukturierten und unstruktuierten Daten

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Marco Büchler

Extraktion semantischer Beziehungen aus natürlicher Sprache durch Nutzung sprachlichen Wissens aus der Kindersprache

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sandy Pleißner

Text Mining for Quality and Service

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Christian Lehmann

Clustering und Klassifikation von Personennamen

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Robert Lokaiczyk

Kontextsensitive und domänenspezifische Rechtschreibekorrektur durch Einsatz von Work-Assoziationen

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Rolf Sabsch

2005

Webbasierte Editierwerkzeug zum Wortschatz-Wörterbuch mit linguistischer Unterstützung

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Andreas Fritzsche

Textminingverfahren zur Ermittlung von Webseiten mit Stellenangeboten auf linguistisch-statistischer Basis

Diplomarbeit
Author: Christian Lehmann

Angewandte Situationstheorie: Gewinnung von Informationen aus Text und Möglichkeiten der Verwendung

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Nicki Klett

Untersuchung sprachunabhängiger statistischer Verfahren für die Übersetzung von Fachbegriffen zur Unterstützung des Verstehens fremdsprachlicher Texte

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Lars Wachsmuth

Statistikbasierte Sprachidentifikation auf Satzbasis

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sven Teresniak

Korpussuchmaschine mit Berücksichtigung linguistischer Merkmale wie Flexion und Wortklasse

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Marcel Anacker

Konzeptionelle Zooms auf semantischen Netzen

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Martin Christian

Evaluation und Verknüpfung von Kookkurrenzen höherer Ordnung und Probabilistic Latent Semantic Analysis

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Marek Mahn

Vergleich von Verfahren zur Ermittlung des semantischen Ähnlichkeit von Websites auf Basis von Termvektoren und Linkstruktur

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Sebastian Buntin

2004

Text, Wörter, Mophene – Möglichkeiten einer automatischen Terminologieextraktion

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Dr. Hans Friedrich Witschel

Extraktion von Textelementen mittels „spreading activation“ für indikative Textzusammenfassungen

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff
Author: Michael Barth

Optimierung von Suchmechanismen in webbasierten eGovernment-Anwendungen anhand des Einsatzes von Methoden der Automatischen Sprachverarbeitung

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer
Author: Patrick Mairif

no year given

PSI-Repository für _linked_ Topic Maps

Masterarbeit
Advisor: Benjamin Bock | Jun.-Prof. Lutz Maicher

Die konsistente Nutzung von Gegenstandsanzeigern (PSI, Ψ, subject identifier) ist die Grundlage für die semantische Interoperabilität in Topic Maps. Immer dann, wenn zwei Topics identische PSIs nutzen, werden sie zusammengeführt. Temporal und …

Bachelor- und Masterarbeiten im Infrastrukturprojekt CLARIN-D

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart

CLARIN-D ist eine auf Metadaten basierende Forschungsinfrastruktur für Geistes- und Sozialwissenschaften. Für die textorientierten Geisteswissenschaften sind interaktive Text-Analyse- und Annotations-Verfahren für typische eHumanities Anwendungen …

Limbic Maps als Klassifikationsgrundlage


Implementierung eines Morphologieanalysesystems


Automatische Wörterbucherstellung mittels Trans-Kookkurrenzen aus dem JRC-Acquis

Diplomarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Yan Wu

Graphische Visualisierung von Korpusdaten am Beispiel von Parallelkoordinaten

Masterarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Sergej Vintgolc

Evaluierung von Hadoop und MapReduce-Algorithmen für ökonometrische Clusteranalysen

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Jun.-Prof. Lutz Maicher

Big data wird zunehmend in der ökonomischen Forschung wichtig. In dieser Arbeit sollen in Kooperation mit dem Fraunhofer MOEZ die Möglichkeit skalierbarer Verfahren für ökonometrische Clusteranalysen an einem konkreten Beispiel evaluiert werden. …

Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Sebastian Sander

Termextraktion auf antiken Texten

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler

Datenintegration heterogener Quellen im Kontext der eHumanities

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: David Pansch

Mental Maps: Aufbau von orts- und zeitabhängigen Bedeutungsräumen zum automatischen Erkennen politischer und gesellschaftlicher Zäsuren im historischen Kontext

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: David Stange

Local Text Reuse Detection mittels Diskreter Kosinustransformation auf Grafik-Hardware

Diplomarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler

Fragmentarische Autoren - Extraktion altgriechischer Eigennamen und Belegstellen auf Antiken Texten

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Maria Moritz

Visualisierung von Kookkurrenzgraphen

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Marco Büchler
Author: Frederik Baumgardt

Multi-Label Klassifikation am Beispiel der sozialwissenschaftlicher Texte

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Jochen (*) Tiepmar
Author: Nathanael Philipp

(im Rahmen des Projektvorhabens „Postdemokratie“, verbunden mit einer SHK-Stelle)

In einer umfassenden Dissertation (Scharkov 2012) wurden verschiedene Klassifikationsverfahren für ihre Eignung in den Sozialwissenschaften und der Medienanalyse …

Auswertung von Briefköpfen für die Dokumentklassifikation

Masterarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Daniel Isemann
Author: Robert Noack

Im Rahmen der Qualifikationsarbeit sollen unter Verwendung von OCR-Koordinaten und Cluster-Verfahren Textabschnitte in Briefköpfen wie Absender, Adressat, Datum und Betreff erkannt werden und daraus mit einem lexikalischen Ansatz Personennamen, …

Vergleichende Analyse von Zeitreihen auf der Basis von Worthäufigkeiten der Wörter des Tages 2009 bis 2014

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Marcel Kisilowski

Logfileanalyse facettenbasierter IR-Systeme

Bachelorarbeit
Advisor: Prof. Dr. Gerhard Heyer | Dr. Thomas Eckart
Author: Alexander Hellwig

Mit dem Virtual Language Observatory (VLO, http://catalog.clarin.eu/vlo/) stellt die Forschungsinfrastruktur CLARIN-D eine Suchmaschine für linguistische Metadaten zur Verfügung die sowohl Volltextsuche als auch facettierte Suche erlaubt. Im Rahmen …

Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart | Dr.-Ing. Christoph Kuras
Author: Linda Gräßler

Im Rahmen des Projektes CLARIN-D werden u.a. verteilte Suchverfahren für Anfragen auf digitale Textressourcen implementiert (“Federated Content Search”, http://weblicht.sfs.uni-tuebingen.de/Aggregator/).
Ziel der Arbeit ist die Entwicklung (oder …

Aufbereitung von Texten in vereinfachtem und traditionellem Chinesisch - Evaluierung bestehende Verfahren für Tokenisierung und POS-Tagging


Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart

Performance-Analyse der Webcorpus-Toolchain auf dem HPC-System Taurus

Bachelorarbeit
Advisor: Prof. Dr. Uwe Quasthoff | Dr. Thomas Eckart
Author: Felix Brei

Semantische Keyword/Begriffslisten Extraktion aus Forschungsberichten und passende Anwendungen

Masterarbeit
Advisor: Dr. Andreas Niekler

Keywords können aus Texten durch unterschiedliche Strategien extrahiert werden. Über Kookkurrenzen können die Keywords einen Textes ergänzt und erweitert werden. Zusätzlich können manuell gepflegte Keyword Listen genutzt werden, um die Daten …

Anwendung von Constrained Multi Label Textklassifikation in Wissensgraphen (Mit mehr Komplexität gerne auch als Masterarbeit)

Bachelorarbeit
Advisor: Janos Borst | Dr. Andreas Niekler

Mit Graph-basierten Datenstrukturen kann jedem Dokument ein eindeutiger Bedeutungsbezug zugordnet werden. Dieser Bedeutungsbezug zeigt eine Abhängigkeit mehrerer Dateneigenschaften. Gehört ein Dokument zu einem Fachgebiet A, so kann es nicht …

Retrieval Performanz im Amazon Alexa Skill zur Flugsuche

Bachelorarbeit
Advisor: Dr. Andreas Niekler