Dies ist die archivierte Webseite der ASV. Aktuellere Informationen finden Sie unter temir.org und über die Suchfunktion auf uni-leipzig.de
ASV-Label
Login

16px-feed-icon Verfahren der ASV View this page in English

Erkennung von Eigennamen

Eine Vorstufe des Information Extraction ist die Named Entity Extraction, die sich mit dem Erkennen von Eigennamen in Texten befasst. Eine Unteraufgabe ist das Erkennen von Personennamen. Im Rahmen der Diplomarbeit von Chris Biemann wurde ein Verfahren entwickelt (Pendel-Verfahren), das durch Bootstrapping von einer Handvoll Vor- und Nachnamen ausgehend eine große Liste von Personennamen und Berufsbezeichnern mit hoher Präzision erstellt. Diese werden in einem anschliessenden Schritt dazu verwendet, mit dem Namenserkenner NameRec Vorkommen von Personennamen mit und ohne Berufsbezeichner zu taggen. NameRec verwendet dazu ausgiebig Gazetteers (Namenslisten), kann aber auch unbekannte Namensteile durch Überprüfen weiterer Belegstellen im Korpus erkennen.

Ansprechpartner: Jun. Prof. Dr. Chris Biemann