WS 2017/18

Tools für Computerlinguist/innen

 

Tools für Computerlinguist/innen


Wintersemester 2017/18
Prof. Dr. Alexander Koller

Proseminar, BSc Computerlinguistik

Fr 10-12, CIP-Raum, C72


In diesem Proseminar erarbeiten wir uns einen Überblick über Standard-Tools und -Ressourcen, die wir in der computerlinguistischen Forschung und Entwicklung verwenden. Damit sind sowohl Standardwerkzeuge der Softwareentwicklung gemeint (z.B. Git oder Mercurial für Versionskontrolle, Flask für die schnelle Entwicklung von Python-basierten Webseiten) als auch Off-the-shelf-Tools für maschinelles Lernen (Weka, Tensorflow) und computerlinguistische Grundlagenaufgaben (Tokenisierung, POS-Tagging, Named Entity Recognition, Parsing, Spracherkennung und -synthese). Die Vertrautheit mit solchen Tools wird Ihre Arbeit an computerlinguistischen Aufgabenstellungen effektiver machen, indem Sie sich auf die Teilaufgaben konzentrieren können, die nicht von einem solchen Werkzeug abgedeckt werden.

Die Veranstaltung richtet sich an Studierende in der Anfangsphase des BSc Computerlinguistik. Teilnehmer/innen sollten erfolgreich an der Vorlesung “Einführung in die Computerlinguistik” teilgenommen haben. Die Vorlesung “Programmierkurs I” sollte zumindest parallel zum Proseminar besucht werden.

Sie bereiten als Teilnehmer/in dieses Proseminars eine komplette Sitzung zu einem spezifischen Tool vor. Am Anfang halten Sie einen halbstündigen Vortrag, in dem Sie den Zweck und die Funktionsweise Ihres Tools erklären. In der restlichen Zeit leiten Sie dann die anderen Teilnehmer/innen bei einer (von Ihnen gestalteten) Übung an, mit der diese Ihr Tool selbst ausprobieren können. In den Semesterferien schreiben Sie dann eine Hausarbeit, in der Sie Ihr Tool nochmal näher darstellen.