ASV-Label
Login

16px-feed-icon Laufende Projekte View this page in English

Die Bibliothek der Milliarden Wörter

Dieses Projekt ist beendet.

„Die Bibliothek der Milliarden Wörter“ ist ein Kooperationsprojekt zwischen der Universitätsbibliothek Leipzig, der Abteilung für Automatische Sprachverarbeitung am Institut für Informatik an der Universität Leipzig, und der Abteilung für Bild- und Signalverarbeitung am Institut für Informatik an der Universität Leipzig. Dieses Projekt wird gefördert aus Mitteln des Europäischen Sozialfonds (ESF). Das Projekt bearbeitet die technischen Probleme auf dem Weg zu einer Digitalisierungsinfrastruktur die den gesamten Weg vom gescannten Dokument zur Aufbereitung von Textuellen Daten in Form von Statistiken und Visualisierungen abdeckt. Hierzu gehören die Archivierung von allen Zwischenprodukten und die Vervollständigung und Korrektur von Metadaten. Außerdem sollen einfache OCR Resultate in das reichere XML-TEI Format übertragen und in einer elektronischen Zitationsinfrastruktur angeboten werden. Schließlich werden Visualisierungslösungen entwickelt, die es möglich machen werden eine ständig wachsende Zahl von Texten einer wissenschaftlichen Untersuchung zu unterziehen.


Förderprogramm: ESF
Partner: Universitätsbibliothek Leipzig, Abteilung für Bild und Signalverarbeitung
Zeitrahmen: Mai 2013 - Dezember 2014

Kontakt: Christoph Teichmann, Dr. Dirk Goldhahn, Prof. Dr. Gerhard Heyer