awisiorek / kb22

Kursseite für die Vorlesung "Korpusbearbeitung in der Computerlinguistik"

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Vorlesung "Korpusbearbeitung in der Computerlinguistik"

Sommersemester 2022

Centrum für Informations- und Sprachverarbeitung, LMU München

Aktuelles:

Die Veranstaltung wird voraussichtlich in Präsenz (Raum B001) stattfinden (evtl. auch als hybride Veranstaltung, also mit paralleler Übertragung per Zoom).

Termin:

  • Vorlesung: Do 14:15-15:45 (Axel Wisiorek), Raum: B001

Moodle-Kursseite:

https://moodle.lmu.de/course/view.php?id=21638

  • Die Anmeldung ist verpflichtend; Moodle dient als Kommunikations- und Verwaltungsplattform.
  • Einschreibeschlüssel wird per LSF-Rundmail bekanntgegeben (ebenso ggf. der Zoom-Link)

Themen:

Datum Nr Vorlesung
Do, 28.04.2022 0 Shell-Grundlagen
Do, 05.05.2022 1 Korpusverarbeitung mit Shell-Skripten
Do, 12.05.2022 2 Korpusverarbeitung mit Python: NLTK
Do, 19.05.2022 3 Korpusannotation mit stanza und spaCy
Do, 26.05.2022 - (Feiertag)
Do, 02.06.2022 4 Korpusanalyse mit pandas
Do, 09.06.2022 5 Korpusanalyse mit scikit-learn
Do, 16.06.2022 - (Feiertag)
Do, 23.06.2022 6 Textmanipulation und Encoding mit der Shell: sed, awk, recode, uconv
Do, 30.06.2022 7.1 Semistrukturierte Daten und XML-Korpora: etree, Beautiful Soup
Do, 07.07.2022 7.2 XML-Parsing + PROBEKLAUSUR
Do, 14.07.2022 KLAUSURVORBEREITUNG
Do, 21.07.2022 KLAUSUR
Do, 28.07.2022 8+9 8. Erzeugen eigener POS-Tagger: NLTK, TreeTagger
9. Korpus-APIs (DTA) und Webcrawler

Klausur:

Datum Termin
Do, 21.07.2022 14 Uhr

About

Kursseite für die Vorlesung "Korpusbearbeitung in der Computerlinguistik"


Languages

Language:Jupyter Notebook 99.0%Language:Python 0.7%Language:Shell 0.3%Language:Awk 0.1%