ASV-Label
Login

16px-feed-icon Laufende Projekte View this page in English

Algorithmische korpusbasierte Ansätze zum typologischen Sprachvergleich

Dieses Projekt ist beendet.

Es gibt eine Vielzahl von Forschungsarbeiten, in denen linguistische Korpora verwendet werden, um die Strukturen einzelner Sprachen zu untersuchen; dagegen gibt es nur sehr wenige Studien, in denen linguistische Strukturen sprachübergreifend auf korpuslinguistischer Grundlage untersucht werden. Dieses Projekt widmet sich der Entwicklung quantitativer und korpusbasierter Methoden zur Analyse sprachlicher Strukturen aus typologischer bzw. sprachvergleichender Perspektive. Dabei gehen wir davon aus, dass sich eine gute
Annäherung an die Strukturen einzelner Sprachen mitHilfe von generellen algorithmischen Verfahren erreichen lässt. Die Ziele des Projekts lassen sich in drei Punkten zusammenfassen: Ersten werden wir Korpora zu wenig erforschtenSprachen mit computerlinguistischen Verfahren so weit aufarbeiten, dass sie für einen typologischen Sprachvergleich zur Verfügung stehen. Da die so aufgearbeiteten Korpora nicht annotiert sind, werden wir ergänzend mit parallelen Korpora arbeiten, die für uns einen Ausgangspunkt bilden, um die nichtannotierten Korpora mit automatischen Verfahren zu untersuchen. Zweitens wird dieses Projekt bestehende Algorithmen benutzen und neue Algorithmen entwickeln, um die von uns
erstellten Korpora zu annotieren und um einschlägige Statistiken für die automatische Bestimmung typologischer Parameter komplexer Sätze aus den Korpora zu extrahieren. Schließlich soll in der zweiten Projektphase der Forschergruppe untersucht werden, wie viel sprachliches Wissen zu einzelnen Sprachen erforderlich ist, um einen typologischen Parameter zu bestimmen.


Partner: Michael Cysouw, Forschungszentrum Deutscher Sprachatlas. Philipps-Universität Marburg

Kontakt: Dr. Dirk Goldhahn, Prof. Dr. Uwe Quasthoff

Veröffentlichungen