Text Mining - Wissensrohstoff Text - Vorlesung Übung, Praktikum
Wintersemester 2011/2012 • Modul: Text Mining – Wissensrohstoff Text (10-201-2301) • Mittwoch, 09:15 Uhr • Hörsaalgebäude - HS 15Referenten: Prof. Dr. Gerhard Heyer
Informationen zur Prüfung:
Prüfung:
Mittwoch, 15.02.2012 – 09:15 Uhr
Prüfungsergebnisse:
| Matrikel | Note |
|---|---|
| 1033141 | 5 |
| 1481800 | 3,7 |
| 1581902 | 3,7 |
| 1793828 | 3,3 |
| 2133716 | 4,0 |
| 2136269 | 2,7 |
| 2137753 | 3,7 |
| 9512094 | 3,7 |
- Termine für Prüfungseinsicht und Nachprüfung bitte per E-Mail vereinbaren. Nachprüfungen werden mündlich durchgeführt.
12.10.2011
Einführung: Von Texten und Termen zu Wissen; Textmerkmale und Features für das Text Mining; Wesentliche Ansätze: String basierte Verfahren, Patterns, machine learning, Kookkurrenzen; Gliederung und Aufbau der Vorlesung
Dateien:
Vorlesung 1
19.10.2011
Muster basierte Ansätze: Erkennung von named entities (NER), Pendelalgorithmus, Probleme der Evaluation und Parametrisierung
Dateien:
Vorlesung 2 |
Vorlesung 2 - Projekt QUID
26.10.2011
Verallgemeinerung: Musterbasierte Relationenextraktion, SERS
Dateien:
Vorlesung 3
02.11.2011
Stringbasierte Verfahren im allgemeinen, N-Gramme, Editierdistanz und Alignment; Anwendung: Text Reuse und Analyse von Zitationsspuren
Dateien:
Vorlesung 4 - Strings und Text Reuse
09.11.2011
Topic Modelle 1 – Grundlagen, PLSI und LSI
Dateien:
Vorlesung 5
23.11.2011
Topic Modelle 2 –LDA, Anwendungen
Dateien:
Vorlesung 6
30.11.2011
Clustering und Klassifikation, Übersicht; Clustering: Hard Clustering, k-means; Anwendung: Dokumentenclustering in hochdimensionalen Vektorräumen; Komplexitätsprobleme, Möglichkeiten der Visualisierung
Dateien:
Vorlesung 7 - Clustering
07.12.2011
Klassifikation, Bayes'scher Klassifikator, hierarchische Klassifikation
Dateien:
Einfache Klassifikatoren (Bayes, LDA)
14.12.2011
Klassifikation: Entscheidungsbäume und Kernel Classifiers
Dateien:
Klassifikation 2 (Entscheidungsbäume, Kernels, Boosting)
04.01.2012
Kookkurrenz basiertes Text Mining; Merkmale von Kookkurrenzen; Anwendungen und das Problem des long tails
Dateien:
Kookkurrenzbasiertes Text Mining |
Vector Space Semantics
11.01.2012
Topic Detection – Probleme und Lösungsansätze; Allen, McCallum; Kontextvolatilität und „heiße“ Themen
18.01.2012
Analyse sozialer Netzwerke – Ziele, Probleme und Lösungsansätze, Algorithmus von Flake, spieltheoretische Ansätze
25.01.2012
Sentiment Analysis; Grundlagen, wesentliche Ansätze und Anwendungen
01.02.2012
Präsentation von Praktikumsergebnissen
15.02.2012
Prüfung
(09.15 Uhr)


Topic Maps Lab
Wortschatz