TMS - Text Mining Services
Konferenz,
23.03.2009
– 25.03.2009
Mediencampus, Leipzig, Deutschland
Die systematische und strukturierte Beschaffung, Erzeugung, Aufbereitung, Verwaltung, Präsentation, Verarbeitung, Publikation, und Wiederverwendung von Inhalten (Contents) ist eine wesentliche Voraussetzung von High Tech Services. Contentdienste stellen hierfür die erforderlichen Ressourcen und Programme bereit. Öffentlich verfügbare digitale Text- und Datenressourcen werden über einen gemeinsamen Standard vernetzt und erschlossen. Verfahren wie Text- und Data Mining für die Erschließung, Aufbereitung, Auswertung und Verarbeitung von öffentlichen und privaten digitalen Ressourcen werden über eine geeignete Architektur verfügbar und für die Anwendung in konkreten Scenarien parametrisierbar gemacht.
Text- und Content Mining sind für Internet basierte Medien Services der nächsten Generation und intelligente Suchdienste von großer Bedeutung. Portale der nächsten Generation werden diese Services anbieten. Sie bilden die Grundlage der sog. E-Humanities. Von wirtschaftlichem Interesse sind Text Mining Services im Verlagswesen, der journalistischen Analyse, der Qualitätsanalyse und –sicherung in der Industrie, der Patent- und Technologiebeobachtung, im Trend Mining und Trendmanagement sowie der Medien- und Marketinganalyse.
In Zusammenarbeit mit dem Institut für Informatik und dem Institut für Wirtschaftsinformatik sowie dem Historischen Seminar an der Universität Leipzig, der Hochschule für Technik, Wirtschaft und Kultur Leipzig und der Leipzig Graduate School of Managment sowie den vom BMBF geförderten Projekten eAQUA (http://www.eaqua.net/), D-SPIN (http://www.sfs.uni-tuebingen.de/dspin/index.shtml), Topic Maps 2.0 Lab (http://www.topicmapslab.de/) und dem EU Projekt CLARIN (http://www.clarin.eu/) werden auf dieser Fachtagung aktuelle Forschungsfragen und Lösungsansätze vorgestellt und diskutiert. Die Veranstaltung beschäftigt sich mit dem aktuellen State of the Art von Text Mining Services und bietet eine Plattform für den intensiven Austausch zwischen Forschung und Praxis sowie verschiedener Disziplinen.
Conference Presentations
Montag, 23. März
- Tutorial: Topic Maps – Semantic Technologies
Lutz Maicher (University of Leipzig, Topic Maps Lab) - Tutorial: Text Mining for Humanities
Marco Büchler (University of Leipzig, eAqua Project) - Tutorial: Webservices and Infrastructures
Volker Boehlke (University of Leipzig, D-SPIN Project)
Workshop Sentiment Analysis
- Sentiment in German-language News and Blogs, and the DAX
Robert Remus (University of Leipzig), Khurshid Ahmad (Trinity College, Dublin), Gerhard Heyer (University of Leipzig) - Feature Difference Quantity: Classification Using Feature Distribution
Alexander Mehler (University of Frankfurt), Ulli Waltinger (University of Bielefeld) - Correlating Market movements with consumer confidence and sentiments: A longitudinal study
Nicholas Daly (Trinity College, Dublin), Khurshid Ahmad (Trinity College, Dublin), Colm Kearny (Trinity College, Dublin) - How to Design Textmining Services for Marketing Research Applications
Daniel Wagenführer (University of Hamburg)
Dienstag, 24. März
Keynote SABRE
Martin Jetter (IBM Germany)
Relation Extraction based on Unsupervised Syntactic Parsing
Martin Schierle (Daimler AG), Christian Haenig (Daimler AG)
Entity Resolution by Kernel Methods
Anja Pilz (Fraunhofer IAIS St. Augustin), Lukas Molzberger (Fraunhofer IAIS St. Augustin), Gerhard Paaß (Fraunhofer IAIS St. Augustin)
DI.ANA: A digital intelligence service to support strategic decisions based on textual data – A report on 5 years of development and application experience at a global OEM
Peter Walde (Volkswagen AG)
Structured Knowledge for Low-Resource Languages: The Latin and Ancient Greek Dependency Treebanks
David Bamman (The Perseus Project, Tufts University), Gregory Crane (The Perseus Project, Tufts University)
Word Lists, Concordances, Text Comparison, and Morphology in Latin and Ancient Greek Texts
Robert Maier (eAqua Project)
Language Resources, Taxonomies and Metadata
Erhard Hinrichs (University of Tuebingen), Lothar Lemnitzer, (University of Tuebingen), Andreas Witt (University of Tuebingen)
A prototype infrastructure for DSpin-services based on an flexible XML data interchange format
Volker Boehlke (University of Leipzig, D-SPIN Project)
Mittwoch, 25. März
Text Mining – Creating Semantics in the real world
Stefan Wrobel (Fraunhofer IAIS, St. Augustin)
Automatic Extraction of Topic Maps based Argumentation Trails
Lutz Maicher (University of Leipzig, Topic Maps Lab), Marco Büchler (University of Leipzig, eAqua Project), Benjamin Bock (University of Leipzig, Topic Maps Lab)
Applying Domain Knowledge from Structured Citation Formats to Text and Data Mining: Examples Using the CITE Architecture
Gabriel Weaver (Dartmouth Computer Science Department), Neel Smith (College of the Holy Cross)
Realising interoperability for digital Classics resources
Tobias Blanke (King’s College London), Mark Hedges (King’s College London), Gabriel Bodard (King’s College London)
TextGrid – Research Infrastructure for the e-Humanities
Martina Kerzel (Göttingen State and Universtity Library), Heike Neuroth (Göttingen State and Universtity Library), Jens Mittelbach (Göttingen State and Universtity Library)
LLS – A 4 Years Summary of Providing Linguistic Web Services
Marco Büchler (University of Leipzig, eAqua Project), Gerhard Heyer (University of Leipzig)
Discussion Panel
The key points of each TMS session will be summarized and evaluated by the session chairpersons. The panel will attempt to deliver an overview of some of the key issues in text mining services, solutions and approaches presented during the conference, and open questions remaining.
Chair: Gerhard Heyer (University of Leipzig)
Ansprechpartner: Prof. Dr. Gerhard Heyer, Sven Windisch