ASV-Label
Login

16px-feed-icon Laufende Projekte View this page in English

eXChange

Dieses Projekt ist beendet.

Ziel des Forschungsvorhabens “eXChange” ist es, innovative Beiträge für die systematische Erforschung von Konzept- und Bedeutungsverschiebungen in der antiken Welt auf Basis der überlieferten Texte zu leisten.

Bei eXChange handelt es sich um ein Kooperationsprojekt der ASV mit der Abteilung für Bild- und Signalverarbeitung (BSV) und den Leipziger Altertumswissenschaften (Alte Geschichte und Klassische Philologie). Eine methodische Verzahnung von Text Mining, Visual Analytics und historischer Diskursanalyse ermöglicht neue Blickwinkel auf existierende Korpora digitalisierter griechischer und lateinischer Texte des Altertums, deren Entstehung bis ins 8. vorchristliche Jahrhundert zurückreicht.

Neben der multilingualen und stark diachronen Ausdehnung der umfangreichen Textdaten ergeben sich durch die Einbettung in den Forschungskontext weitere Besonderheiten: So sind die Metadaten, die zu einzelnen Dokumenten und den ihnen zugeordneten Autoren erfassbar sind, teilweise lückenhaft, spekulativ und innerhalb der Wissenschaftscommunity kontrovers diskutiert. Nicht zuletzt ist die Zuordnung von Autoren oft selbst Teil historischer Hypothesen. Im Projekt werden daher dynamische Metadatenfacetten zugelassen: eine Änderung aller Einträge und Zuordnungen kann jederzeit erfolgen und verändert “in Echtzeit” die Sicht auf das Gesamtkorpus. Entsprechend muss die Erfassung und Verwaltung dieser oft pro Nutzer unterschiedlich gesetzten Metainformationen als separate Aufgabe des Wissensmanagements behandelt werden. In unmittelbarer Konsequenz der flexiblen Facettierung ergeben sich enorme technische Herausforderungen für das Text Mining, besonders in der Indizierung und Strukturierung der Datenbasis und der Gestaltung effizienter Zugriffsmethoden.

Aufsetzend auf den Text-Mining-Methoden, wird in enger Kooperation mit der BSV eine Open-Source-Rechercheanwendung entwickelt, mit deren Hilfe Hypothesen zum Konzeptwandel und -transfer aufgestellt, formalisiert, überprüft und angepasst werden können. Dabei sollen Hypothesenbausteine und Analyseergebnisse expliziert werden und in geeigneter Form auch kollaborativ bearbeitet werden können. Basis dafür ist die Adaption konzeptbasierter Korpusabfragen, welcher eine domänenspezifische Konzeptualisierung einzelner Begrifflichkeiten über Sprachgrenzen hinweg ermöglicht.

Die Beschäftigung mit dieser Abstraktion der einfachen Suche nach Zeichenketten geht einher mit einer explorativen und gleichzeitig kritischen Auseinandersetzung mit den erfassten Texten. Die direkte Nutzerinteraktion mit Konzepten und durch sie beschriebenen Belegstellen, ergänzt durch unterstützende statistische Kennzahlen, erlaubt ein Arbeiten im Stil der Visual Analytics, welches die wissenschaftliche Hypothesenbildung auf qualitative wie quantitative Weise fördert.

Als technologische Grundlage der Text-Mining-Methoden werden aktuelle Werkzeuge des Big-Data-Ökosystems, sowie alternative Datenbanksysteme auf Ihre Eignung für Textdaten untersucht und ggf. angepasst. Intern werden die Komponenten mittels einer serviceorientierten Infrastruktur verbunden, die eine Integration in die Forschungsinfrastruktur CLARIN ermöglicht.


Förderprogramm: BMBF – Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities
Partner: Abteilung für Bild- und Signalverarbeitung, Altertumswissenschaften
Zeitrahmen: Jul 2012 – Sep 2015

Kontakt: Dr. Thomas Efer

Veröffentlichungen