Automatische Anreicherung von OAI-Metadaten
This project has been ended.
Automatische Anreicherung von OAI-Metadaten mit Hilfe computerlinguistischer Verfahren und Entwickung von Services für die inhaltsorientierte Vernetzung von Repositorien
Projektleitung/Geschäftsführung:
Dr. Wolfram Horstmann (CIO Wissenschaftliche Information an der Universität Bielefeld) , Prof. Dr. Alexander Mehler (Uni Bielefeld), Prof. Dr. Gerhard Heyer (ASV)
Der Zugang zu hochwertiger Fachinformation ist eine wichtige Grundvoraussetzung des Wissenschaftsbetriebs. Die zunehmende Bereitstellung elektronischer Publikationen in verteilten offenen Wissensspeichern (“Repositorien”) und ihre Zusammenführung, etwa im Rahmen der Open Archives Initiative (OAI), leisten dazu bereits heute einen substantiellen Beitrag. Das DFG-geförderte Projekt “Automatische Anreicherung von OAI-Metadaten mit Hilfe computerlinguistischer Verfahren und Entwicklung von Services für die inhaltsorientierte Vernetzung von Repositorien” zielt auf die Verbesserung der inhaltlichen Erschließung dieser wissenschaftlichen Dokumente durch OAI-Metadaten.
Im Rahmen des Projekts sollen zunächst Dokumente ohne ausreichende klassifikatorische Sacherschließungsinformationen mit texttechnologischen Verfahren automatisch nach der Dewey Decimal Classification (DDC) klassifiziert und die Klassifikationsinformation in die Metadaten integriert werden. Die so angereicherten Daten können dann in verschiedenen Kontexten Verwendung finden, etwa zurück an Repositorien geliefert oder in wissenschaftliche Suchmaschinen wie die Bielefeld Academic Search Engine (BASE) aufgenommen werden. Die Daten sollen für andere Organisationen zur Nachnutzung bereitgestellt werden. Durch homogenere Klassifikationsinformation soll letztendlich die inhaltsorientierte Vernetzung von verteilten Repositorien gefördert werden. Semantisches Browsing durch die Dokumente nach Fachgebieten und semantische Suche werden möglich und verbessern die Recherchequalität.
Das Projekt verbindet die Bereiche digitale Bibliothek und Texttechnologie: Während die Universitätsbibliothek hochwertige Dokumentmengen über eine standardisierte Schnittstelle verfügbar macht, liefert die Texttechnologie die linguistisch fundierten Klassifikationsergebnisse.
Support program: DFG
Partner: Dr. Wolfram Horstmann (CIO Wissenschaftliche Information an der Universität Bielefeld), Prof. Dr. Alexander Mehler (Uni Bielefeld)
Kontakt: Prof. Dr. Gerhard Heyer
Publications