Prof. Dr. Gerhard Heyer
Phone: +49-341-97-32231 Address: Postal Address: |
|
Vita
Gerhard Heyer has studied Mathematical Logic and Philosophy at Cambridge University (Philosophy Tripos, Christ’s College 1973-1976, Robert-Birley Scholarship), and General Linguistics at the University of the Ruhr, where he received his Ph.D. in 1983. After research on AI based natural language processing at the University of Michigan, Ann Arbor, with support by the Alexander-von-Humboldt Foundation (Feodor-Lynen Scholarship) he has been working as a systems specialist and manager within the Olivetti Group for establishing TA Triumph Adler´s activities on research and development in electronic publishing and natural language processing. He has also been responsible for the definition and performance of, a.o., ESPRIT projects Translator´s Workbench, Translator´s Workbench II, and MultiLex.
Since April 1994, Gerhard Heyer holds the chair on Automatic Language Processing at the computer science department of the University of Leipzig. His field of research is focussed on automatic semantic processing of natural language text with applications in the area of information retrieval and search as well as knowledge management.
Gerhard Heyer has been a member of numerous programme, reviews and recruitment committees, and has served as a member of the scientific advisory council of the GESIS Institute IZ from 1997 until 2006. He also was a member of the GESIS Kuratorium from 2006 to 2007.
At the faculty of Mathematics and Computer Science of the University of Leipzig he served as dean of studies from 1999 until 2002, and dean of the faculty from 2002 – 2005, re-elected for the period 2005-2008.
Teaching
Sommersemester 2013- Algorithmen und Datenstrukturen 2 Lecture
- Bachelor- & Masterseminar Seminar
- Linguistische Informatik Lecture
- Linguistische Informatik Exercise
- Algorithmen und Datenstrukturen 1 Lecture
- Bachelor- & Masterseminar Seminar
- Text Mining - Wissensrohstoff Text Lecture
aktuelle Projekte
- Sprachdatenressourcen – Deutscher Wortschatz, multilinguale Corpora und Wörter-des-Tages
- CLARIN-D
- Automatische Anreicherung von OAI-Metadaten
- Masterprogramm Medien Leipzig - MML
abgeschlossene Projekte
- Musica Migrans 3
- Extraktion von Entitäten und Relationen aus domänenspezifischen Texten
- D-SPIN/CLARIN
- Musica Migrans
- Untersuchungen zum Repertoire des Leipziger Thomanerchors
- Optimierung von Suchmöglichkeiten in Moduln zum E-Learning und elektronischen Dokumenten der Präsenzlehre auf der Basis von Dublin Core Meta-Daten an der Universität Leipzig (HSE)
- Medienresonanzanalyse
- Inhaltsbasierte Agenten für digitale Bibliotheken
- Evaluation des natürlichsprachlichen Dialogsystems NLI – Z39.50
- Moderation VR
Events
- Textworkshop on Scalable Visual Analytics
- Clarin WP2 Workshop
- ASV Offsite Meeting
- eHumanities – Welchen Nutzen hat die Informatik?
- Informatik 2010 | Service Science – Neue Perspektiven für die Informatik
- LLNM 2010 - Leipzig Linguistic Network Meeting
- Visual Document Analytics Workshop 2009
- TMS - Text Mining Services
Open theses
- Bachelor- und Masterarbeiten im Infrastrukturprojekt CLARIN-D
- Erstellung eines Lehrkonzepts für den Einsatz des Programms Rapid Miner in den Vorlesungen Text Mining und Linguistische Informatik
- Standardisierte Formalisierung von Organigrammen zur inhaltlichen Interpretation der Veränderungen
- Text-Mining-basierte Untersuchung von Shakespeares Werken
Current Theses
Finished Theses
- Architektur und Evaluation von Szenorien für die Integration von e-Learning Plattformen und Content Management Systemen
- Aspekte der Automatisierung der Schlagwortvergabe am Beispiel des Libri-Produktkatalogs
- Automatic Extension of Semantic Lexicons with a Bootstrapping Algorithm
- Automatische Erstellung zweisprachiger Wörterbücher aus Paralleltexten – Ein sprachunabhängiger Ansatz
- Automatische Extraktion von Termhierarchien aus Dokumentenkollektionen für die semantische Strukturierung (Extraction of Term Hierarchies for the Semantic Structuring of Document Collections)
- Clustering und Klassifikation von Personennamen
- Data und Text Mining für das CRM am Beispiel ausgewählter Kundendaten
- Datenintegration heterogener Quellen im Kontext der eHumanities
- Datenintegration heterogener Quellen im Kontext der eHumanities
- Einbringen von Wissen in Volltext-Suchmechanismen für Recherche- und Analysesysteme (mit Hilfe von Apache Lucene und Topic Maps)
- Evaluation und Verknüpfung von Kookkurrenzen höherer Ordnung und Probabilistic Latent Semantic Analysis
- Evaluierung von Hadoop und MapReduce-Algorithmen für ökonometrische Clusteranalysen
- Finding and Analyzing Social Networks in unstructured web log data using probabilistic topic modeling
- Flexibles Berechnen von Kookkurrenzen auf strukturierten und unstruktuierten Daten
- Fragmentarische Autoren - Extraktion altgriechischer Eigennamen und Belegstellen auf Antiken Texten
- Information-Retrieval in einem P2P-Netz mit Small-World-Eigenschaften -- Simulation und Evaluation des SemPIR-Modells
- Integration von Daten der Semantic Web/Linked Data-Community in ISOcat/RELcat
- Klassifikation dynamischer Textströme – Eine Erweiterung der inhaltsbasierten Textkategorisierung
- Kontextsensitive und domänenspezifische Rechtschreibekorrektur durch Einsatz von Work-Assoziationen
- Konzeption und Implementierung einer semantischen Suchmaschine für Topic Maps
- Konzeption und Implementierung eines Topic-Maps-basierten Community-Portals
- Konzeption und Realisierung eines multilingualen Systems zur Erkennung benannter Entitäten
- Konzeptionelle Zooms auf semantischen Netzen
- Local Text Reuse Detection mittels Diskreter Kosinustransformation auf Grafik-Hardware
- Mental Maps: Aufbau von orts- und zeitabhängigen Bedeutungsräumen zum automatischen Erkennen politischer und gesellschaftlicher Zäsuren im historischen Kontext
- Modellierung des Entscheidungsprozesses und Entwicklung eines Werkzeugs zur Unterstützung der Grammatikerstellung für Sprachdialogsysteme
- Models of random text production for investigating repetition and reuse in language development
- Morphologische Analyse von antiken Texten im sprach-evolutionärem Wandel
- Optimierung von Suchmechanismen in webbasierten eGovernment-Anwendungen anhand des Einsatzes von Methoden der Automatischen Sprachverarbeitung
- Performanceanalyse von SOAP- und REST- basierten Services in einer Linguistic Resources Umgebung
- Phrasenbasierte Stimmungsanalyse
- REST-basierter, virtueller Topic aps-View für unstrukturierte Text-Korpora
- Schwierigkeiten bei der Anwendung vollständig-entscheidbarer Deduktionsalgorithmen auf reale Ontologien und deren Anwendung zur semantischen Analyse Englischer Texte
- Sentence Boundary Detection
- Strategien, Konzepte und prototypische Entwicklung einer Software für die semiautomatische Analyse chronologischer Textmuster in Zeitscheibenkorpora
- Termextraktion auf antiken Texten
- Text Mining for Quality and Service
- Text, Wörter, Mophene – Möglichkeiten einer automatischen Terminologieextraktion
- Textanalyse und Korrektur von durch OCR-Verfahren gewonnenem Text
- Textvervollständigung auf antiken Texten
- Visualisierung von Kookkurrenzgraphen
Publications
2013-
[IT12VBGHPW]
Volker Boehlke, Gerhard Heyer, and Peter Wittenburg: IT-Based Research Infrastructures for the Humanities and Social Sciences - Developments, Examples, Standards, and Technology. 2013
BibTeX
-
[HeyHolTer2012]
Gerhard Heyer, Florian Holz, and Sven Teresniak: P2P-based communication. In: Handbook of Applied Linguistics, Volume Technical Communication, Alexander Mehler, Laurent Romary, Dafydd Gibbon: Berlin/New York, 2012
BibTeX
-
[BGH2012]
Marco Büchler, Gregory Crane, and Gerhard Heyer: Historical Relevance Feedback Detection by Text Re-use Mining. In: Maximilian Schich, Roger Malina, Isabel Meirelles, Christian Huepe: Arts, Humanities, and Complex Networks Living Companion at Arts, Humanities, and Complex Networks — 3rd Leonardo satellite symposium hosted by NetSci2012, Evanston, IL, USA, 2012
BibTeX
-
[KWH12unsupervised]
Amit Kirschenbaum, Peter Wittenburg, and Gerhard Heyer: Unsupervised morphological analysis of small corpora: First experiments with Kilivila. In: Potentials of Language Documentation: Methods, Analyses, and Utilization. Language Documentation & Conservation Special Publication, Manoa: University of Hawai‘i Press, 2012
BibTeX
-
[NJH12]
Andreas Niekler, Patrick Jähnichen, and Gerhard Heyer: ASV Monitor: Creating Comparability of Machine Learning Methods for Content Analysis. In: Proceedings of the ECML-PKDD 2012, Springer, 2012
BibTeX
-
[EBH2012]
Thomas Efer, Jens Blecher, and Gerhard Heyer: Leipziger Rektoratsreden 1871 - 1933 Insights into Six Decades of Scientific Practice. In: International Conference on Historical Corpora, 2012
BibTeX
|
Download
-
[GH11]
Gerhard Heyer: Learning Semantic Relations from Text. In: Modeling, Learning and Processing of Text Technological Data Structures, Berlin/New York, Springer, 2011
BibTeX
-
[HeyEtAl2011]
Gerhard Heyer, Daniel Keim, Sven Teresniak, and Daniela Oelke: Interaktive explorative Suche in großen Dokumentbeständen. Springer Berlin / Heidelberg, 2011
BibTeX
|
Download
-
[TeiEtAl]
Torsten Teichert, Gerhard Heyer, Katja Schöntag, and Patrick Mairif: Co-Word Analysis for assessing consumer associations: A case study in market research. In: Affective Computing and Sentiment Analysis, Springer Science+Business Media B.V. , 2011
BibTeX
-
[Hey2011]
Gerhard Heyer: Soziale Netzwerke und inhaltsbasierte Suche in Peer-to-Peer Systemen. In: Interdependez und Dynamik sozialer und sprachlicher Netzwerke, VS Verlag: Köln, Barbara Job und Alexander Mehler, 2011
BibTeX
-
[SDH11HBB]
Gerhard Heyer, Marco Büchler, and Volker Boehlke: Aspects of an Infrastructure for eHumanities. In: Supporting Digital Humanities 2011, 2011
BibTeX
-
[BCMBH2011]
Marco Büchler, Gregory Crane, Martin Mueller, Philip Burns, and Gerhard Heyer: One Step Closer To Paraphrase Detection On Historical Texts: About The Quality of Text Re-use Techniques and the Ability to Learn Paradigmatic Relations. Chicago, IL, USA, 2011
BibTeX
-
[HBEM2011]
Gerhard Heyer, Marco Büchler, Thomas Eckart, and Maria Moritz: eAQUA - Extraktion von strukturiertem Wissen aus Antiken Quellen für die Altertumswissenschaften: Technologien und Ansätze zu Infrastruktur, Text Mining und Knowledge Transfer. Leipzig, Leipzig University, 2011
BibTeX
-
[holz-etal-ivapp2010]
Florian Holz, Sven Teresniak, Gerhard Heyer, and Gerik Scheuermann: Generating a Visual Overview of Large Diachronic Document Collections based on the Detection of Topic Change. In: Proc. IVAPP 2010: International Conference on Information Visualization Theory and Applications, 2010
BibTeX
-
[RemQuaHey2010]
Robert Remus, Uwe Quasthoff, and Gerhard Heyer: SentiWS -- a Publicly Available German-language Resource for Sentiment Analysis. In: Proceedings of the 7th International Language Resources and Evaluation (LREC), 2010
BibTeX
|
Download
-
[infspek2010]
Christian Rohrdantz, Steffen Koch, Charles Jochim, Gerhard Heyer, Gerik Scheuermann, Thomas Ertl, Hinrich Schütze, and Daniel A. Keim: Visuelle Textanalyse. Springer Berlin / Heidelberg, 2010
BibTeX
-
[OestVast10]
Patrick Oesterling, Gerik Scheuermann, Sven Teresniak, Gerhard Heyer, S. Koch, Thomas Ertl, and G. H. Weber: Two-stage Framework for a Topology-Based Projection and Visualization of Classified Document Collections. In: IEEE Conference on Visual Analytics Science and Technology (IEEE VAST), IEEE Computer Society, 2010
BibTeX
-
[BGHE10]
Marco Büchler, Annette Geßner, Gerhard Heyer, and Thomas Eckart: Detection of Citations and Text Reuse on Ancient Greek Texts and its Applications in the Classical Studies: eAQUA Project. In: Proceedings of Digital Humanities 2010, London, 2010
BibTeX
-
[HB2010]
Gerhard Heyer and Marco Büchler: Some Challenges Posed to Computer Science by the eHumanities. In: Proceeding to 44. Jahrestag der Gesellschaft für Informatik e.V.: Service Science - Neue Perspektiven für die Informatik, Leipzig, Springer-Verlag, 2010
BibTeX
-
[BH2010]
Marco Büchler and Gerhard Heyer: Salton and Wittgenstein in the Humanities: About Semantics in Philosophical Texts. In: Proceeding to 44. Jahrestag der Gesellschaft für Informatik e.V.: Service Science - Neue Perspektiven für die Informatik, Leipzig, Springer-Verlag, 2010
BibTeX
-
[heyer-kdir09]
Gerhard Heyer, Florian Holz, and Sven Teresniak: Change of Topics over Time and Tracking Topics by Their Change of Meaning. In: KDIR 2009: Proc. of Int. Conf. on Knowledge Discovery and Information Retrieval, INSTICC Press, 2009
BibTeX
|
Download
-
[BH09]
Marco Büchler and Gerhard Heyer: Leipzig Linguistic Services - A 4 Years Summary of Providing Linguistic Web Services . In: Proceeding of TMS 2009 conference: To appear., Augustusplatz 10/11, 04109 Leipzig, Germany, 2009
BibTeX
-
[ter09dbs]
Sven Teresniak, Gerhard Heyer, Gerik Scheuermann, and Florian Holz: Visualisierung von Bedeutungsverschiebungen in großen diachronen Dokumentkollektionen. Datenbank-Spektrum 31, dpunkt.verlag, 2009
BibTeX
|
Download
-
[TMS09]
Gerhard Heyer: Text Mining Services – Building and applying text mining based service infrastructures in research and industry, Proceedings of the Conference on Text Mining Services – TMS 2009 at Leipzig University. Leipziger Beiträge zur Informatik, Leipzig, 2009
BibTeX
-
[GH-TMS09]
Gerhard Heyer: Introduction. In: Text Mining Services – Building and applying text mining based service infrastructures in research and industry, Proceedings of the Conference on Text Mining Services – TMS 2009 at Leipzig University, 2009
BibTeX
-
[RemAhmHey2009]
Robert Remus, Khurshid Ahmad, and Gerhard Heyer: Sentiment in German-language News and Blogs, and the DAX. In: Proceedings of the Conference on Text Mining Services (TMS), 2009
BibTeX
|
Download
-
[DZM+09]
Haimonti Dutta, Xianshu Zhu, Tushar Muhale, Hillol Kargupta, Kirk Borne, Codrina Lauth, Florian Holz, and Gerhard Heyer: TagLearner: A P2P Classifier Learning System from Collaboratively Tagged Text Documents. In: Proceedings of the 3rd International Workshop on Mining Multiple Information Sources (MMIS-09), Miami, 2009
BibTeX
-
[GSCL09VB]
Hinrichs, E., Hinrichs, M., Zastrow, T., Heyer G., Boehlke, V., Quasthoff, U., Schmid, H., Heid, U., Fritzinger, F., Siebert, A., and Didakowski, J.: Weblicht: Web-based LRT services for German. Workshop on linguistic processing pipelines. In: GSCL Jahrestagung 2009, 2009
BibTeX
-
[heyer-etal-2008-wrt]
Gerhard Heyer, Uwe Quasthoff, and Thomas Wittig: Text Mining: Wissensrohstoff Text -- Konzepte, Algorithmen, Ergebnisse. W3L-Verlag, 2008
BibTeX
-
[THSM08]
Teichert, Th., Heyer, G., Schöntag, K., and Mairif, P.: Co-Word Analysis for Assessing Consumer Associations: A Case Study in Market Research. In: Proceedings of „Sentiment Analysis: Emotion, Metaphor, Ontology and Terminology (EMOT-08)", 2008
BibTeX
-
[GRH+08]
Gottwald, S., Richter, M., Heyer, G., and Scheuermann, G.: Tapping
Huge Temporally Indexed Textual Resources with WCTAnalyze. In: Proceedings of the LREC 2008, Marrakech, Morroco, 2008
BibTeX
-
[biemann-etal-08-toolbox]
C. Biemann, U. Quasthoff, G. Heyer, and F. Holz: ASV Toolbox -- A Modular Collection of Language Exploration Tools. In: Proceedings of the 6th Language Resources and Evaluation Conference (LREC) 2008, 2008
BibTeX
|
Download
-
[MWH08]
Alexander Mehler, Ulrich Waltinger, and Gerhard Heyer: Towards Automatic Content Tagging: Enhanced Web Services in Digital Libraries Using Lexical Chaining. In: 4th International Conference on Web Information Systems and Technologies (WEBIST '08), Funchal, Portugal , 2008
BibTeX
-
[BHG08]
Marco Büchler, Gerhard Heyer, and Sabine Gründer: eAQUA - Bringing modern Text Mining approaches to two thousand years old ancient texts. In: Proceedings of the 4th International Conference on e-Science (IEEE08), 2008
BibTeX
|
Download
-
[HB07]
Heyer, G. and Bordag, S.: A Structuralist Framework for Quantitative Linguistics. In: Aspects of Automatic Text Analysis / Series: Studies in Fuzziness and Soft Computing, Berlin, New York, Springer, 2007
BibTeX
-
[GHR+07]
Gottwald, S., Heyer, G., Richter, M., and Walde, P.: WCTAnalyze - Collecting, Indexing, Accessing and Visualizing Temporally Indexed Textual Resources. In: Proceedings of TIME2007, Alicante, Spain, 2007
BibTeX
-
[BHQ+07]
Biemann, C., Heyer, G., Quasthoff, U., and Richter, M.: The Leipzig Corpora Collection - Monolingual corpora of standard size. In: Proceedings of Corpus Linguistic 2007, Birmingham, UK, 2007
BibTeX
-
[holz-etal-07-framework]
F. Holz, H. F. Witschel, G. Heinrich, G. Heyer, and S. Teresniak: An Evaluation Framework for Semantic Search in P2P Networks. In: Proceedings of the I2CS 2007, 2007
BibTeX
|
Download
-
[GHRW07]
Sebastian Gottwald, Gerhard Heyer, Matthias Richter, and Peter Walde: WCTAnalyze - Collecting, Indexing, Accessing and Visualizing Temporally Indexed Textual Resources . In: Proceedings of TIME-07, Alicante, Spain, 2007
BibTeX
-
[BH07]
Marco Büchler and Gerhard Heyer: Kookurenzberechnungen mit UIMA und Medusa . In: UIMA Workshop at the GLDV 2007 in Tübingen/Germany, 2007
BibTeX
-
[HQ06]
Gerhard Heyer and Uwe Quasthoff: Calculating Communities by Link Analysis of URLs . Springer Berlin/Heidelberg, 2006
BibTeX
|
Download
-
[BBHM04a]
C. Biemann, C. Böhm, G. Heyer, and R. Melz: Automatically Building Concept Structures and Displaying Concept Trails for the Use in Brainstorming Sessions and Content Management Systems. In: Proceedings of I2CS, Guadalajara, Mexico, Springer, 2004
BibTeX
-
[BHSW04]
C. Biemann, G. Heyer, F. Schmidt, and H.F. Witschel: Eine Wissenlandkarte der Knowtech. In: N. Gronau, B. Petkoff, T. Schildhauer (Hrsg.): Wissensmanagement - Wandel, Wertschöpfung, Wachstum., Berlin, Gito, 2004
BibTeX
-
[BBHM04b]
C. Biemann, K. Böhm, G. Heyer, and R. Melz: SemanticTalk: Software for Visualizing Brainstorming Sessions and Thematic Concept Trails on Document Collections. In: Proceedings of ECML/PKDD, Pisa, Italy, Springer, 2004
BibTeX
-
[GH04]
Gerhard Heyer: Optimierung von Suchmöglichkeiten im E-Learning durch Metatags. In: Proceedings LIT04, Leipzig, 2004
BibTeX
-
[bordag-etal-03-small]
Bordag, S., Heyer, G., and Quasthoff, U.: Small worlds of concepts and other principles of semantic search. In: Proc. I2CS 2003, 2003
BibTeX
|
Download
-
[HH03]
Gerhard Heyer and Thomas Hoppe : Virtuelle Gemeinschaften mit der Lernplattform Moderation VR . In: Workshop on e-Learning 2003, HTWK Leipzig , Leipzig, 2003
BibTeX
-
[HHM02]
Gerhard Heyer, Thomas Hoppe, and Katrin Müller : Die Wortschatzmethode als netzbasierte Kreativitätstechnik in einer virtuellen Lernumgebung . In: Information und Mobilität, Optimierung und Vermeidung von Mobilität durch Information. Proceedings des 8. Internationalen Symposiums für Informationswissenschaft (ISI 2002), Regensburg, 8. – 11. Oktober 2002 , Konstanz, UVK Verlagsgesellschaft mbH , 2002
BibTeX
-
[GH00]
Gerhard Heyer: Digitalisierung und das Entstehen neuer Wertschöpfungsketten durch elektronisches Publizieren. In: Kommunikation in der Informationsgesellschaft: Vom digitalen Buch zum computergestützten Lernen, Ringvorlesung des Instituts für Informatik und Instituts für Kommunikations- und Medienwissenschaft der Universität Leipzig, Leipzig, 2000
BibTeX


Topic Maps Lab
Wortschatz