ASV-Label
Login

16px-feed-icon Lehrveranstaltung View this page in English

Text Mining - Wissensrohstoff Text - Vorlesung Übung, Praktikum

Wintersemester 2020/2021   •  Modul: Text Mining – Wissensrohstoff Text (10-201-2301)  •  Montag, 13:15 Uhr  •  asynchron Video

Referenten:  Dr. Andreas Niekler

Zusatzinformationen:

Organization

Announcement: Wir wurden jetzt benachrichtigt, dass die Prüfung in digitaler Form ermöglicht werden soll, d.h. sie kann nicht in Präsenz stattfinden. Daher brauchen wir so oder so eine digitale Lösung und wir würden uns dabei für die erweiterten Praktikumsberichte entscheiden. Wenn wir keine Beanstandung bekommen werden wir die Prüfungsleistung also zu einer Abgabe eines erweiterten Praktikumsberichtes abändern. Erweitert heißt in dem Fall:

1. Bezug auf Inhalte der Vorlesung
2. Wissenschaftliche Ausführung der Vorgehensweise
3. Beitragszuordnung zu den Projektgruppenteilnehmern.

Wir werden die Praktikumsberichte am 28.2. erwarten. Die Präsentationen werden 18. und 25. Januar stattfinden. Hierfür werden wir die Zeiten der Übung, des Praktikums und des Vorlesungs Q&A nutzen. Ich hoffe, dass Sie alle die Zeit finden Ihren Kommilitonen zuzuhören.

18.1.2021 — 9:15 – 14:45
25.1.2021 — 9:15 – 15:45

Bitte teilen Sie uns einen 1. und 2. Wunsch mit, sodass wir hier einen Zeitplan machen können. Nach jetzigem Stand werden für jede Präsentation dann etwa 15 min zur Verfügung stehen. Nach der Festlegung der Termine werden wir hier aber die Details der Länge nachreichen.

Announcement: We have now been notified that the exam will be enabled in digital form, meaning it cannot be done in presence. So either way we need a digital solution and we would opt for the extended internship reports for that. If we don’t get any objections we will change the exam to an extended internship report. Extended means in this case:

1. reference to the contents of the lecture
2. scientific execution of the procedure
3. contribution assignment to the project group participants.

We will expect the internship reports on 2/28. The presentations will be January 18 and 25. For this we will use the times of the exercise, internship and lecture Q&A. I hope you all find the time to listen to your fellow students.

18.1.2021 — 9:15 – 14:45
25.1.2021 — 9:15 – 15:45

Please let us know a 1st and 2nd preference so we can make a schedule here. As it stands now, there will then be about 15 min for each presentation. However, after the dates are set, we will post the details of the length here.

Lecturer: Dr. Ing. Andreas Niekler

Lab Advisor: Christian Kahmann

There is a waiting list. The practical work is mandatory for completing the module. Everybody who not signed up for a practical work topic by 13.11.2020 will be replaced by someone from the waiting list since you won’t be able to complete the module.

Module Workload: 2 SWS Lecture, 1 SWS Lab, 3 SWS Practical Work, 300 WP

Lecture, Practical Work and Lab will take place online until further notice throughout the semester.

Online sessions will take place in the form of weekly Q&A sessions on BigBlueButton.

Practical work participation is a prerequisite to complete the module.

Lectures are prerecorded. The videos can be accessed by following the lecturenotes below. Starting from 26.10.2020 we will add the videos for the current week during the week. Please keep an eye on the lecture page here.

Q&A session: Monday, 13:15 – 14:45 starting from 02.11.2020, on BigBlueButton: https://conf.informatik.uni-leipzig.de/b/and-vex-f47

Lab Monday, 9:15 – 10:45, starting 09.11.2020

Practical Work Q&A Monday, 11:15 – 12:45, starting 02.11.2020 with presentation of assignments.

Communication

Lecture website – materials and announcements will be uploaded on this website.

Email -* important announcements will be sent out via mail. To compile a email list, please write an initial mail to the lecturer and we will add you to the list.*

27.10.2020: To introduce yourself, find groups for practical work and get help we also opened a moodle course. Please sign in here – We decide later if we switch comminication to moodle. Depends on how many people sign up there.

26.10.2020   Text Mining Intro


Folien Organisatorisches + Text Mining Einleitung
-
Video Organisatorisches
Video Text Mining Einleitung
-
Folien Empirische Forschung, Korpuslinguistik, Textstatistik, Datenakquise
-
Video Empirische Forschung
Video Korpuslinguistik
Video Textstatistik
Video Datenakquise


02.11.2020   Vorverarbeitung, Morphologie

Folien Wortphänomene, Preprocessing, Morphologie
-
Video Wortphänomene
Video Preprocessing
Video Morphologie


09.11.2020   Textmodelle I, Häufigkeitsanalyse, Schlüsselwortextraktion

Folien Textmodelle I
Folien Häufigkeitsanalyse, Keywordanalyse
-
Video Textmodelle I
Video Häufigkeitsanalyse
Video Keywordanalyse


16.11.2020   POS Tagging, Grammatiken, Syntax

Folien Grammatik, Syntax, Dependencies
Folien Wortphänomene, Preprocessing, Morphologie, POS Tagging UPDATE
-
Video POS Tagging
Video Grammatiken in NLP
Video Reguläre Grammatiken
Video Kontexfreie Grammatiken, Konstituenten, Dependencies


23.11.2020   Semantik, Kookkurrenzen, Informationen Extraktion

Folien Semantik
Folien Anwendungen, Kookkurrenzen, Informationen Extraktion UPDATE
-
Video Semantik Intro
Video Lexikalische Semantik
Video Kompositionelle Semantik
Video Diskurs-level Semantik
Video Distributionelle Semantik
-
Video Kookkurrenz Analyse
Video Informationen Extraktion


30.11.2020   Clustering auf Textdaten

Folien Similarity Maße UPDATE Folienatz Text Models
Folien Clustering UPDATE Folienatz Applications
-
Video Similarity Maße
Video Clustering


07.12.2020   Topic Models

Folien Topic Modelle und Modellselektion/Evaluation UPDATE Folienatz Text Models


Video Topic Modelle
Video Topic Modelle Evaluierung, Modellauswahl


14.12.2020   Klassifikation von Textdaten

Folien Klassifikation UPDATE Folienatz Anwendungen


Video Klassifikation Intro
Video Klassifikation, Datensätze
Video Klassifikation, Evaluation
Video Klassifikation, Algorithmen
Video Regression, Algorithmen


21.12.2020   Vorlesung

Christmas Break until 11th of January


11.01.2021   Text Mining Pipelines, Best Practices, Bibliotheken

Folien Embeddings UPDATE Folienatz Textmodelle

Folien Prozessketten, Effizienz, Robustheit


Video Word Embeddings
Video Prozessketten
Video Effektivität
Video Effizienz
Video Robustheit