Morphologische Analyse
Ziele
Ziel einer vollständigen morphologischen Analyse ist die Beschreibung und Nutzbarmachung der Struktur der Wörter. Herkömmliche Nutzungsarten sind die sogenannte Grundformreduzierung, Fachtermextraktion, Beschlagwortung, Klassifikation usw.
Dabei kann als Ziel bereits die einfache regelbasierte Grundformreduktion ausreichend sein, stellt jedoch lediglich einen Spezialfall dar, der die Kompleität des Problems vereinfacht.
Ein von unserer Abteilung verfolgtes Ziel ist es, die Prinzipien der Morphologie dahin gehend zu verstehen, um Algorithmen entwickeln zu können, die die morphologische Struktur von Wörtern einer beliebigen Sprache ohne zusätzlichen Aufwand erfassen und nutzbar machen können.
Verfahren
Ein in den letzten Jahren verfolgter Ansatz, die morphologische Struktur von Wörtern beliebiger Sprachen zu erfassen ist, zunächst eine Segmentierung in Morphe anzustreben. Das Wort “Spracherkennung” würde dabei in die Morphe “Sprach” und “er” und “kenn” und “ung” zerlegt werden. Ein weiteres Verfahren würde dann herausfinden, dass das Morph “kenn” zu dem Morphem gehört, welches durch die Morphe “kenn.kann.könn.konn” repräsentiert wird. Dies wiederum würde es erlauben, z.B. im Information Retrieval Dokumente nicht nur durch Wörter und auch nicht durch Morphe, sondern durch Morpheme darzustellen.
Ein seit 2005 entwickeltes Verfahren, das sogenannte “LSV Based Morphe Analysis Algorithm” hierzu kann heruntergeladen und auf eine beliebige Sprache angewandt werden.
Einige Einschränkungen gibt es jedoch – Sprachen mit sogenannter nicht-konkatenativer Morphologie werden dabei nicht korrekt analysiert. Ausserdem lässt die Qualität der Analyse im Vergleich zu sprachspezifischen regelbasierten Systemen noch vieles zu wünschen übrig.