Multi-Label Klassifikation am Beispiel der sozialwissenschaftlicher Texte (Bachelorarbeit)
Status: beendetBeschreibung:
(im Rahmen des Projektvorhabens „Postdemokratie“, verbunden mit einer SHK-Stelle)
In einer umfassenden Dissertation (Scharkov 2012) wurden verschiedene Klassifikationsverfahren für ihre Eignung in den Sozialwissenschaften und der Medienanalyse evaluiert. Diese Verfahren wurden an einem manuell annotierten Korpus getestet. Dabei wurden Klassifikatoren eingesetzt, die pro Textdokument nur ein Label zuordnen können. Unter der Annahme, dass sozialwissenschaftliche Texte meist mehr als ein Thema oder mehr als eine Rubrik enthalten können, soll eine vergleichbare Analyse mit Fuzzy-Klassifikatoren und Algorithmen wie LDA oder pLSA durchgeführt werden, um auch Multi-Label Zuordnungen für Dokumente zu evaluieren.
Autor: Nathanael PhilippBetreuer: Jochen (*) Tiepmar | Prof. Dr. Gerhard Heyer