Canonical Text Services
This project has been ended.
Die Abteilung für Automatische Sprachverarbeitung stellt einen Server für Canonical Text Services (CTS) für Anwender zur Verfügung. Dieser kann beispielsweise als Publikations – und/oder Zitationstool verwendet werden oder es Softwareentwicklern ermöglichen, beliebig große Textmengen auf einzeilige URNs zu reduzieren und auf diesem Weg den Speicherverbauch von textlastigen Anwendungen zu reduzieren.
Aufbauend auf CTS – und dessen Verwendung als Textstandard – wird der CTS-Server um möglichst umfassende und generisch verwendbare Methoden der Textanalyse erweitert. Um die Attraktivität und Zugänglichkeit zu erhöhen, werden in Zusammenarbeit mit der Abteilung für Bild- und Signalverarbeitung generische Tools entwickelt, die die Visualisierung und Akquise von Daten standardisieren und erleichtern.
Durch die einfache Installation und die Möglichkeit, Daten über CTS zu klonen, wird dabei sichergestellt, dass neue Anwender bei Bedarf sofort und unkompliziert ihre eigene CTS-Instanz aufsetzen können und die damit verbundenen Tools und Methoden zur Analyse, Visualisierung und Abfrage der Daten sowohl online als auch offline nutzen können.
CTS-Project Website
Im Rahmen des Förderprogramms „Kompetenzzentren für den intelligenten Umgang mit großen Datenmengen (Big Data)“ wird das Forschungsvorhaben „ScaDS Dresden/Leipzig – Competence Center for Scalable Data Services and Solutions“ vom Bundesministerium für Bildung und Forschung (BMBF) gefördert. ScaDS Dresden/Leipzig wurde offiziell am 13. Oktober 2014 gestartet und hat damit den Grundstein für die Schaffung eines nationalen Kompetenzzentrums für Big Data gelegt. Das Forschungvorhaben ist auf vier Jahre ausgelegt und wird durch die Partner Technische Universität Dresden (TUD), Universität Leipzig (UL), Max-Planck-Institut für molekulare Zellbiologie und Genetik (MPI-CBG) und dem Leibnitz-Institut für ökologische Raumplanung getragen. Thematisch beschäftigt sich das Kompetenzzentrum mit den wichtigsten Herausforderungen auf dem Gebiet der Akquise, Handhabung und Verwertung großer Datenbestände für ein breites Anwenderspektrum.
Time frame: seit 10/2014
Kontakt: Dr. Jochen Tiepmar, Prof. Dr. Gerhard Heyer
Publications
- TEGK16 - Canonical Text Services in CLARIN - Reaching out to the Digital Classics and beyond
- CTSTM2016 - CTS Text Miner - Text Mining Framework based on the Canonical Text Service Protocol
- CTSRelease - Release of the MySQL-based implementation of the CTS protocol
- TEGK2017 - Integrating Canonical Text Services into CLARIN's Search Infrastructure
- TH2017 - An Overview of Canonical Text Services
- GTEGK17 - Digital Muqtabas CTS Integration in CLARIN
- Dr_CTS - Implementation and Evaluation of the Canonical Text Service Protocol as Part of a Research Infrastructure in the Digital Humanities
- cts_classics_beyond - The Canonical Text Services in Classics and Beyond
- cts_eval - A Big Data Case Study in Digital Humanities: Creating a Performance Benchmark for Canonical Text Services
