ASV-Label
Login

16px-feed-icon Veröffentlichungen View this page in English

Bue08a

Abstract:

Mit dem exponentiellen Wachstum der zur Verfügung
stehenden Daten im Internet, wächst auch das darin
gespeicherte Wissen.

Ziel dieser Arbeit ist, verschiedene statistische
Verfahren zur Extraktion von semantischen und
syntaktischen Beziehungen zwischen Wörtern zu
vergleichen. Dabei werden neben klassischen
Kookurrenzen auch die distanzabhängigen Kookkurrenzen
eingeführt.

Diese Aufgaben setzen große Datenmengen voraus. Um
dies auch auf mehrere Millionen Sätze anwenden zu
können, werden performante Datenstrukturen benötigt.
Weiterhin werden einige Heuristiken für das
performante Speichern von mehreren Milliarden
Kookkurrenz-Datensätzen vorgestellt und deren
Auswirkungen gemessen.

Type: Book

Author: Marco Büchler
Title: Medusa: Performante Textstatistiken auf großen Textmengen:
Publisher: Vdm Verlag Dr. Müller
Year: 2008
Address:
Month:September
Note:http://www.amazon.de/Medusa-Performante-Textstatistiken-Textmengen-Kookkurrenzanalyse/dp/3639011252
Pages:128
Language:German
@BOOK{Bue08a,
AUTHOR = {Marco Büchler},
TITLE = {Medusa: Performante Textstatistiken auf großen Textmengen: },
PUBLISHER = {Vdm Verlag Dr. Müller},
YEAR = {2008},
MONTH = {September},
NOTE = {http://www.amazon.de/Medusa-Performante-Textstatistiken-Textmengen-Kookkurrenzanalyse/dp/3639011252},
PAGES = {128},
LANGUAGE = {German}
}