Prof. Dr. Uwe Quasthoff
Phone: +49-341-97-32233 Address: Postal Address: Prof. Dr. Uwe Quasthoff is no longer a staff member of the NLP department. |
![]() |
Vita
1984 Dissertation: Zur Klassifikation der aperiodischen Automorphismen des hyperfiniten Faktors
1988 Habilitation: Zur Klassifikation von Automorphismen von Neumann-Algebren resultierend aus Transformationen auf Shift-Maßräumen
aktuelle Projekte
abgeschlossene Projekte
Finished Theses
- Angewandte Situationstheorie: Gewinnung von Informationen aus Text und Möglichkeiten der Verwendung
- Aufbau eines erweiterbaren Endpunktes für föderierte, linguistische Suchmaschinen
- Aufbereitung von Texten in vereinfachtem und traditionellem Chinesisch - Evaluierung bestehende Verfahren für Tokenisierung und POS-Tagging
- Automatische Wörterbucherstellung mittels Trans-Kookkurrenzen aus dem JRC-Acquis
- Automatischer Aufbau eines multilingualen Thesaurus durch Extraktion semantischer und lexikalischer Beziehungen aus dem Datenbestand der Wikipedia
- Chinesischer Wortschatz: Segmentierung, Erkennung von Organisationsnamen und Integrierung eines Wörterbuchs in die Korpus-Browser
- Chinesischer Wortschatz: Textsammlung mit RSS. Textaufbereitung und statistische Analyse
- Design moderner mobiler Wörterbuch-Anwendungen am Beispiel der Bantusprachen
- Dokumenten-Clustering von tagesaktuellen Zeitungstexten auf der Grundlage der Wörter des Tages
- Ein Satzgenerator für das Deutsche und dessen Anwendung in der natürlichsprachlichen Ausgabe von Datenbankinhalten
- Extraktion semantischer Beziehungen aus natürlicher Sprache durch Nutzung sprachlichen Wissens aus der Kindersprache
- Extraktion von Redewendungen
- Extraktion von Textelementen mittels „spreading activation“ für indikative Textzusammenfassungen
- Graphische Visualisierung von Korpusdaten am Beispiel von Parallelkoordinaten
- Identifizierung und Entdeckung von Sprachen bei Texten des WWW durch Clustern der häufigsten Trigramme
- Implementierung eines semantischen Taggers für die deutsche Sprache mit Hilfe eines Markov Modells
- Integration verbesserter Geodaten in den Wortschatz der Universität Leipzig
- Korpussuchmaschine mit Berücksichtigung linguistischer Merkmale wie Flexion und Wortklasse
- Nichtüberwachte Wörterbucherstellung aus quasiparallelem Text
- Performance-Analyse der Webcorpus-Toolchain auf dem HPC-System Taurus
- Reader’s News – die personalisierte Zeitung
- Semantische Analyse der Linkstrukturen von Webseiten mit Hilfe von sprachstatistischen Methoden
- Statistikbasierte Sprachidentifikation auf Satzbasis
- Statistische Verfahren zur Ermittlung lokaler Ereignisse und damit verbundenen Personen aus Zeitungstexten am Beispiel berühmter Kriminalfälle
- Syntaktische Analyse natürlicher Sprache unter Verwendung statistischer Kookkurenzanalyse
- Untersuchung sprachunabhängiger statistischer Verfahren für die Übersetzung von Fachbegriffen zur Unterstützung des Verstehens fremdsprachlicher Texte
- Untersuchung zur Klassifizierung von Texten nach Autoren bzw. Zeitungen unter zu Hilfenahme von statistischen und anderen Mitteln
- Vergleich von Verfahren zur Ermittlung des semantischen Ähnlichkeit von Websites auf Basis von Termvektoren und Linkstruktur
- Vergleichende Analyse von Zeitreihen auf der Basis von Worthäufigkeiten der Wörter des Tages 2009 bis 2014
- Webbasierte Editierwerkzeug zum Wortschatz-Wörterbuch mit linguistischer Unterstützung
- Wortbedeutungsdisambiguierung mittels sprachunabhängiger, kookkurrenzbasierter Algorithmen
Publications
2020-
[QHKEGB20]
Uwe Quasthoff, Lars Hellan, Erik Körner, Thomas Eckart, Dirk Goldhahn, and Dorothee Beermann : Typical Sentences as a Resource for Valence. In: Proceedings of the 12th International Conference on Language Resources and Evaluation (LREC 2020), Marseille (France), 2020
BibTeX
-
[EBQKGK20]
Thomas Eckart, Sonja Bosch, Uwe Quasthoff, Erik Körner, Dirk Goldhahn, and Simon Kaleschke: Usability and Accessibility of Bantu Language Dictionaries in the Digital Age: Mobile Access in an Open Environment. In: First workshop on Resources for African Indigenous Languages (RAIL) at the 12th Language Resources and Evaluation Conference (LREC 2020), Marseille (France), 2020
BibTeX
-
[GEGQ19]
Dirk Goldhahn, Thomas Eckart, Rufus Gouws, and Uwe Quasthoff: Frekwensiewoordeboek van Afrikaans - A new Frequency Dictionary for Afrikaans. In: Workshop of the African Association for Lexicography (AFRILEX), Windhoek, Namibia, 2019
BibTeX
-
[EBGQK19]
Thomas Eckart, Sonja Bosch, Dirk Goldhahn, Uwe Quasthoff, and Bettina Klimek: Translation-based Dictionary Alignment for Under-resourced Bantu Languages. In: OpenAcess Series in Informatics (OASIcs), Vol. 70: Language Data and Knowledge LDK 2019, 2019
BibTeX
-
[EGQG19]
Thomas Eckart, Dirk Goldhahn, Uwe Quasthoff, and Rufus Gouws: Corpus-based Extraction of Word Relations from an Afrikaans Corpus. In: Workshop of the African Association for Lexicography (AFRILEX), Windhoek, Namibia, 2019
BibTeX
-
[BEKGQ18]
Sonja Bosch, Thomas Eckart, Bettina Klimek, Dirk Goldhahn, and Uwe Quasthoff: Preparation and Usage of Xhosa Lexicographical Data for a Multilingual, Federated Environment. In: Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki (Japan), 2018
BibTeX
-
[KEQG18]
Christoph Kuras, Thomas Eckart, Uwe Quasthoff, and Dirk Goldhahn: Automation, Management and Improvement of Text Corpus Production. In: 6th Workshop on the Challenges in the Management of Large Corpora at the 11th Language Resources and Evaluation Conference (LREC 2018), Miyazaki (Japan), 2018
BibTeX
-
[BGEHQSH18]
Dorothee Beermann, Dirk Goldhahn, Thomas Eckart, Lars Hellan, Uwe Quasthoff, Medadi Ssentanda, and Tormod Haugland: Digital Infrastructure for Morpho-syntactic Analysis of Under-Resourced Languages - A Case Study for Luganda. In: Comparative Corpus Linguistics: New Perspectives and Applications at the 51st Annual Meeting of the Societas Linguistica Europaea (SLE 2018), Tallinn, Estonia, 2018
BibTeX
-
[EGQB18]
Thomas Eckart, Dirk Goldhahn, Uwe Quasthoff, and Sonja Bosch: Cross-Language Dictionary Alignment for Bantu Languages. In: Workshop of the African Association for Lexicography (AFRILEX), 20th International Congress of Linguists (ICL20), Cape Town, South Africa, 2018
BibTeX
-
[MQS18]
Lydia Müller, Uwe Quasthoff, and Maciej Sumalvico: Corpora of Typical Sentences. In: LREC 2018, Eleventh International Conference on Language Resources and Evaluation, Miyazaki, Japan, 2018
BibTeX
-
[TGQ18]
Dieu-Tu Le, Dirk Goldhahn and Uwe Quasthoff: Frequency Dictionary Vietnamese - Từ điển tần số xuất hiện các từ trong tiếng Việt. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2018
BibTeX
-
[SGQ17]
Serge Sharoff, Dirk Goldhahn and Uwe Quasthoff: Frequency Dictionary Russian - Частотный словарь русского языка. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2017
BibTeX
-
[GEQ17]
Dirk Goldhahn, Thomas Eckart, and Uwe Quasthoff: A Portal for Corpus Collection for Under-Resourced Languages. In: Workshop of the African Association for Lexicography (AFRILEX), CLASA 2017, Grahamstown, 2017
BibTeX
-
[EGQ17]
Thomas Eckart, Dirk Goldhahn, and Uwe Quasthoff: Using Corpus Query Engines for Facilitating Lexicographical Analysis of African Languages. In: Workshop of the African Association for Lexicography (AFRILEX), CLASA 2017, Grahamstown, South Africa, 2017
BibTeX
-
[EKQ16]
Thomas Eckart, Christoph Kuras, and Uwe Quasthoff: Features for Generic Corpus Querying. In: Proceedings of the International Conference on Language Resources and Evaluation (LREC), 2016
BibTeX
-
[BHHQEK2016]
Dorothee Beermann, Tormod Haugland, Lars Hellan, Uwe Quasthoff, Thomas Eckart, and Christoph Kuras: Quantitative and Qualitative Analysis in the work with African Languages. In: Workshop on Collaboration and Computing for Under-Resourced Languages (CCURL), LREC, Portorož, 2016
BibTeX
-
[GSQ2016]
Dirk Goldhahn, Maciej Sumalvico and Uwe Quasthoff: Corpus collection for under-resourced languages with more than one million speakers. In: Workshop on Collaboration and Computing for Under-Resourced Languages (CCURL), LREC, Portorož, 2016
BibTeX |
Download
-
[BGQR16]
Solomija Buk, Dirk Goldhahn, Uwe Quasthoff and Andrij Rovenchak: Frequency Dictionary Ukrainian - Частотний словник української мови. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2016
BibTeX
-
[QGE15]
Uwe Quasthoff, Dirk Goldhahn and Thomas Eckart: Building Large Resources for Text Mining: The Leipzig Corpora Collection. In: Text Mining - From Ontology Learning to Automated Text Processing Applications, Springer, 2015
BibTeX
-
[DDGQ15]
Martine Dalmas, Dmitrij Dobrovol'skij, Dirk Goldhahn and Uwe Quasthoff: Bewertung durch Adjektive. Ansätze einer korpusgestützten Untersuchung zur Synonymie. In: LiLi - Zeitschrift für Literaturwissenschaft und Linguistik: Bewerten im Wandel, 2015
BibTeX
-
[KGQ15]
Deny A. Kwary, Dirk Goldhahn and Uwe Quasthoff: Frequency Dictionary Indonesian - Kamus Frekuensi Bahasa Indonesia. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2015
BibTeX
-
[EAQG14]
Thomas Eckart, Faisal Alshargi, Uwe Quasthoff, and Dirk Goldhahn: Large Arabic Web Corpora of High Quality: The Dimensions Time and Origin. In: Workshop on Free/Open-Source Arabic Corpora and Corpora Processing Tools, LREC, Reykjavík, 2014
BibTeX |
Download
-
[EHHQG14]
Thomas Eckart, Erla Hallsteinsdóttir, Sigrún Helgadóttir, Uwe Quasthoff, and Dirk Goldhahn: A 500 Million Word POS-Tagged Icelandic Corpus. In: Proceedings of the International Conference on Language Resources and Evaluation (LREC), 2014
BibTeX |
Download
-
[GQ14]
Dirk Goldhahn and Uwe Quasthoff: Vocabulary-Based Language Similarity using Web Corpora. In: Proceedings of the International Conference on Language Resources and Evaluation (LREC), 2014
BibTeX |
Download
-
[QGEHF14]
Uwe Quasthoff, Dirk Goldhahn, Thomas Eckart, Erla Hallsteinsdóttir and Sabine Fiedler: High Quality Word Lists as a Resource for Multiple Purposes. In: Proceedings of the International Conference on Language Resources and Evaluation (LREC), 2014
BibTeX |
Download
-
[QBG14]
Uwe Quasthoff, Sonja Bosch and Dirk Goldhahn: Morphological analysis for less-resourced languages: Maximum Affix Overlap applied to Zulu. In: Workshop on Collaboration and Computing for Under-Resourced Languages in the Linked Open Data Era, LREC, Reykjavík, 2014
BibTeX |
Download
-
[GRQB14]
Dirk Goldhahn, Steffen Remus, Uwe Quasthoff and Chris Biemann: Top-Level Domain Crawling for Producing Comprehensive Monolingual Corpora from the Web. In: Workshop on Challenges in the Management of Large Corpora (CMLC-2), LREC, Reykjavík, 2014
BibTeX |
Download
-
[QMMEGGM14]
Uwe Quasthoff, Ritwik Mitra, Sunny Mitra, Thomas Eckart, Dirk Goldhahn, Pawan Goyal and Animesh Mukherjee: Large Web Corpora of High Quality for Indian Languages. In: 2nd Workshop on Indian Language Data: Resources and Evaluation, LREC, Reykjavík, 2014
BibTeX |
Download
-
[FGKREGQ14]
Rico Feist, Daniel Gerighausen, Manuel Konrad, Georg Richter, Thomas Eckart, Dirk Goldhahn, and Uwe Quasthoff: Using Significant Word Co-occurences for the Lexical Access Problem. In: Workshop on Cognitive Aspects of the Lexicon (CogALex-IV) at COLING 2014, Dublin, Ireland, 2014
BibTeX
-
[GQH14]
Dirk Goldhahn, Uwe Quasthoff and Gerhard Heyer: Corpus-Based Linguistic Typology: A Comprehensive Approach. In: Proceedings of the 12th Edition of the Konvens Conference, Hildesheim, Germany, 2014
BibTeX |
Download
-
[FGQ14]
Sabine Fiedler, Dirk Goldhahn and Uwe Quasthoff: Frequency Dictionary Esperanto - Oftecvortaro de Esperanto. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2014
BibTeX
-
[EQ13]
Thomas Eckart and Uwe Quasthoff: Statistical Corpus and Language Comparison on Comparable Corpora. In: BUCC – Building and Using Comparable Corpora, Springer, 2013
BibTeX
-
[BBEGQSSSZ13]
Chris Biemann, Felix Bildhauer, Stefan Evert, Dirk Goldhahn, Uwe Quasthoff, Roland Schäfer, Johannes Simon, Leonard Swiezinski, and Torsten Zesch: Scalable Construction of High-Quality Web Corpora. In: Special Issue of the Journal for Language Technology and Computational Linguistics (JLCL), Gesellschaft für Sprachtechnologie und Computerlinguistik, 2013
BibTeX |
Download
-
[QGH13]
Uwe Quasthoff, Dirk Goldhahn and Gerhard Heyer : Technical Report Series on Corpus Building. 2013
BibTeX
-
[KEEQ2013]
Alain Kamber, Daniel Elmiger, Thomas Eckart, and Uwe Quasthoff: Frequency Dictionary French - Dictionnaire de fréquence du français. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2013
BibTeX
-
[GHQ13]
Dirk Goldhahn, Zita Hollós and Uwe Quasthoff: Frequency Dictionary Hungarian - Magyar gyakorisági szótár. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2013
BibTeX
-
[EQG12]
Thomas Eckart, Uwe Quasthoff, and Dirk Goldhahn: Language Statistics-Based Quality Assurance for Large Corpora. In: Proceedings of Asia Pacific Corpus Linguistics Conference 2012, Auckland, New Zealand, 2012
BibTeX
-
[GEQ12]
Dirk Goldhahn, Thomas Eckart, and Uwe Quasthoff: Building Large Monolingual Dictionaries at the Leipzig Corpora Collection: From 100 to 200 Languages. In: Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), 2012
BibTeX |
Download
-
[EQG12a]
Thomas Eckart, Uwe Quasthoff, and Dirk Goldhahn: The Influence of Corpus Quality on Statistical Measurements on Language Resources. In: Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12), 2012
BibTeX
-
[GEQ12a]
Dirk Goldhahn, Thomas Eckart and Uwe Quasthoff: Finding Language Universals: Multivariate Analysis of Language Statistics using the Leipzig Corpora Collection. In: Leuven Statistics Days 2012, Leuven, Belgium, 2012
BibTeX
-
[EHQ2012]
Thomas Eckart, Erla Hallsteinsdóttir, and Uwe Quasthoff: Frequency Dictionary Icelandic - Íslensk tiðniorðabók. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2012
BibTeX
-
[FGQ12]
Sabine Fiedler, Dirk Goldhahn and Uwe Quasthoff: Frequency Dictionary English. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2012
BibTeX
-
[QE11]
Uwe Quasthoff and Thomas Eckart: Vergleichbarkeit von sprachstatistischen Messungen. In: TRANEL 55 Korpuslinguistik - von der quantitativen Analyse zur qualitativen Interpretation, 2011
BibTeX
-
[EHQ2011]
Thomas Eckart, Erla Hallsteinsdóttir, and Uwe Quasthoff: Frequency Dictionary German - Häufigkeitswörterbuch Deutsch. Uwe Quasthoff, Sabine Fiedler and Erla Hallsteindóttir (eds.). Leipziger Universitätsverlag, 2011
BibTeX
-
[RemQuaHey2010]
Robert Remus, Uwe Quasthoff, and Gerhard Heyer: SentiWS -- a Publicly Available German-language Resource for Sentiment Analysis. In: Proceedings of the 7th International Language Resources and Evaluation (LREC), 2010
BibTeX |
Download
-
[EQ10]
Thomas Eckart and Uwe Quasthoff: Statistical Corpus and Language Comparison Using Comparable Corpora. In: Workshop on Building and Using Comparable Corpora, LREC, Malta, 2010
BibTeX
-
[GQ10]
Dirk Goldhahn and Uwe Quasthoff: Automatic Annotation of Co-Occurrence Relations. In: Proceedings of LREC 2010, Valletta, Malta, 2010
BibTeX
-
[QE09]
Uwe Quasthoff and Thomas Eckart: Corpus Building Process of the Project "Deutscher Wortschatz". In: Lingustic Processing Pipelines Workshop at GSCL 2009, 2009
BibTeX
-
[GSCL09VB]
Hinrichs, E., Hinrichs, M., Zastrow, T., Heyer G., Boehlke, V., Quasthoff, U., Schmid, H., Heid, U., Fritzinger, F., Siebert, A., and Didakowski, J.: Weblicht: Web-based LRT services for German. Workshop on linguistic processing pipelines. In: GSCL Jahrestagung 2009, 2009
BibTeX
-
[heyer-etal-2008-wrt]
Gerhard Heyer, Uwe Quasthoff, and Thomas Wittig: Text Mining: Wissensrohstoff Text -- Konzepte, Algorithmen, Ergebnisse. W3L-Verlag, 2008
BibTeX
-
[biemann-etal-08-toolbox]
C. Biemann, U. Quasthoff, G. Heyer, and F. Holz: ASV Toolbox -- A Modular Collection of Language Exploration Tools. In: Proceedings of the 6th Language Resources and Evaluation Conference (LREC) 2008, 2008
BibTeX |
Download
-
[HBQ2008]
Hänig, C., Bordag, S., and Quasthoff, U.: UnsuParse: Unsupervised Parsing with unsupervised Part of Speech tagging. In: Proceedings of the Sixth International Language Resources and Evaluation (LREC 2008), 2008
BibTeX |
Download
-
[BQ07]
Biemann, C. and Quasthoff, U.: Similarity of Documents and Document Collections using Attributes with Low Noise. In: Proceedings of WEBIST-07, Barcelona, Spain, 2007
BibTeX
-
[HEB+07]
Hallsteinsdóttir, E., Eckart, T., Biemann, C., Quasthoff, U., and Richter, M.: Íslenskur orðasjóður - Building a Large Icelandic Corpus. In: Proceedings of NODALIDA-07, Tartu, Estonia, 2007
BibTeX
-
[BHQ+07]
Biemann, C., Heyer, G., Quasthoff, U., and Richter, M.: The Leipzig Corpora Collection - Monolingual corpora of standard size. In: Proceedings of Corpus Linguistic 2007, Birmingham, UK, 2007
BibTeX
-
[QRB06]
Quasthoff, U., Richter, M., and Biemann, C.: Corpus Portal for Search in Monolingual Corpora. In: Proceedings of the LREC 2006, Genoa, Italy, 2006
BibTeX
-
[QB06]
Quasthoff, U. and Biemann, C.: Measuring Monolinguality. In: Proceedings of the LREC-06 workshop on Quality assurance and quality measurement for language and speech resources, Genoa, Italy, 2006
BibTeX
-
[RQH+06]
Richter, M., Quasthoff, U., Hallsteinsdóttir, E., and Biemann, C.: Exploiting the Leipzig Corpora Collection. In: Proceesings of the IS-LTC 2006. Ljubljana, Slovenia., 2006
BibTeX
-
[HQ06]
Gerhard Heyer and Uwe Quasthoff: Calculating Communities by Link Analysis of URLs . Springer Berlin/Heidelberg, 2006
BibTeX |
Download
-
[BBQ04]
C. Biemann, S. Bordag, and U. Quasthoff: Automatic Acquisition of Paradigmatic Relations using Iterated Co-occurrences. In: Proceedings of LREC2004, Lisboa, Portugal, 2004
BibTeX
-
[BBQW04]
C. Biemann, S. Bordag, U. Quasthoff, and C. Wolff: Web Services for Language Resources and Language Technology Applications.. In: Proceedings Fourth International Conference on Language Resources and Evaluation, Lissabon, 2004
BibTeX
-
[BQW04]
C. Biemann, U. Quasthoff, and C. Wolff: Linguistic Corpus Search. In: Proceedings Fourth International Conference on Language Resources and Evaluation, Lissabon, 2004
BibTeX
-
[BSQ04]
C. Biemann, S.Bordag, and U. Quasthoff: Lernen paradigmatischer Relationen auf iterierten Kollokationen. In: LDV-Forum 19 (1/2), GermaNet-Workshop, Tubingen, Gito, 2004
BibTeX
-
[bordag-etal-03-small]
Bordag, S., Heyer, G., and Quasthoff, U.: Small worlds of concepts and other principles of semantic search. In: Proc. I2CS 2003, 2003
BibTeX |
Download