WS 2017/18

Tools für Computerlinguist/innen

 

Tools für Computerlinguist/innen


Wintersemester 2017/18
Prof. Dr. Alexander Koller

Proseminar, BSc Computerlinguistik

Fr 10-12, CIP-Raum, C72

Erster Termin: 27.10.2017 (Sitzung am 20.10. fällt aus)


In diesem Proseminar erarbeiten wir uns einen Überblick über Standard-Tools und -Ressourcen, die wir in der computerlinguistischen Forschung und Entwicklung verwenden. Diese Tools decken eine Bandbreite ab, die von flachen Preprocessing-Schritten (Tokenisierung, Named Entity Recognition, POS-Tagging) über verschiedene Parsingverfahren (Phrasenstruktur, Dependenz) bis hin zu einfachen Modellen für die semantische Analyse (Semantic Role Labeling) und für Dialogsysteme reicht. Abschließend schauen wir uns eine Bibliothek für neuronale Netze sowie ein neuronales Sequence-to-Sequence-Modell an, das z.B. für die maschinelle Übersetzung verwendet werden kann.

Die Vertrautheit mit solchen Tools wird Ihre Arbeit an computerlinguistischen Aufgabenstellungen effektiver machen, indem Sie sich auf die Teilaufgaben konzentrieren können, die nicht von einem solchen Werkzeug abgedeckt werden.

Die Veranstaltung richtet sich an Studierende in der Anfangsphase des BSc Computerlinguistik. Teilnehmer/innen sollten erfolgreich an der Vorlesung “Einführung in die Computerlinguistik” teilgenommen haben. Die Vorlesung “Programmierkurs I” sollte zumindest parallel zum Proseminar besucht werden. Ich setze voraus, dass Sie mit Linux und der Linux-Kommandozeile vertraut sind.

Sie bereiten als Teilnehmer/in dieses Proseminars eine komplette Sitzung zu einem spezifischen Tool vor. Am Anfang halten Sie einen etwa halbstündigen Vortrag, in dem Sie den Zweck und die Funktionsweise Ihres Tools erklären. In der restlichen Zeit leiten Sie dann die anderen Teilnehmer/innen bei einer (von Ihnen gestalteten) Übung an, mit der diese Ihr Tool selbst ausprobieren können. In den Semesterferien schreiben Sie dann eine Hausarbeit, in der Sie Ihr Tool nochmal näher darstellen.