Dies ist die archivierte Webseite der ASV. Aktuellere Informationen finden Sie unter temir.org und über die Suchfunktion auf uni-leipzig.de
ASV-Label
Login

16px-feed-icon Verfahren der ASV View this page in English

Morphologische Grundformreduktion

Für viele Anwendungen der Automatischen Sprachverarbeitung ist es hilfreich, Wortformen, d.h. in verschiedenen Formen auftretende Varianten einer Grundform (z.B. Hauses, Häuser, Häusern zu Haus) zu deren Grundformen zu reduzieren: Dadurch werden Informationen, die über Wortformen vorliegen, an der Grundform akkumuliert, was zu mehr und so statistisch sichereren Daten führt. Um die morpholgische Grundformreduktion praktisch durchzuführen, wird eine Trainingsmenge von Wortformen zusammen mit ihrer Grundform benötigt. Damit wird ein Compact Patricia Tree (ein Mehrwegebaum zur Speicherung von Wortlisten) wird auf die Weise trainiert, dass dieser sich die zu reduzierende Vollform von hinten ansieht und eine Regel ausgibt, mit der die Vollform in die Grundform überführt werden kann. Für in der Trainingsmenge auftretende Beispiele können so die Grundformen perfekt erzeugt werden. Für Vollformen, die nicht in der Trainingsmenge auftreten, werden die Reduktionsregeln mit hoher Genauigkeit geraten, da Vollformen mit gleichen Suffixen in der Regel in gleicher Weise zu Vollformen reduziert werden können (z. B: Zähne → Zahn, dann auch Kähne → Kahn).

Ansprechpartner: Jun. Prof. Dr. Chris Biemann