Michael Pucher (michael dot pucher at oeaw dot ac dot at)

Summer semester 2018: Lecture on Spoken language in human and human-computer dialogue at Speech Communication and Signal Processing Lab at Graz University of Technology

Das zentrale Thema dieser Lehrveranstaltung ist die gesprochene Sprache wie sie in spontanen Dialogen zwischen Menschen und zwischen Mensch und Computer vorkommt. Anhand von Sprachmaterial aus real-life Kontexten wird einerseits erarbeitet, welche sprachlichen Merkmale spontane Dialoge im Vergleich zu gelesenen Texten aufweisen, andererseits werden die Probleme automatischer Spracherkenner und Synthesizer im Umgang mit gesprochenen Dialogen diskutiert und Lösungsvorschläge jüngster Forschungsarbeiten vorgestellt. Diskussionen und Projekte werden in einem interdisziplinärem Team (Studenten der TU und KFU) durchgeführt. Ein Fokus der diesjährigen Vorlesung wird in der menschlichen und maschinellen Sprachproduktion (Sprachsynthese) liegen. In der Sprachsynthese werden wir parametrische Methoden kennenlernen und die Architektur eines Sprachsynthesizers analysieren. In den Übungen sollen zuerst einfache Computerprogramme für den Umgang mit symbolischen Sprachdaten (Transkriptionen, Lexika) in Python entwickelt werden, und anschliessend ein Sprachsynthesizer mit selbst aufgenommenen Daten trainiert werden. Die Trainingsprogramme werden zur Verfügung gestellt. Anschliessend soll die Qualität des Synthesizers bewertet werden.





Slides

Spoken language in human and human-computer dialogue - General Information
Introduction to spoken dialog
Phonetics
Speech signal processing
Speech synthesis
Semantics
Pragmatics (+ Exercise 1)
Exercise 2





Software and data

https://github.com/musescore/MuseScore





Resources

Example for analysis (download first, do not listen!)





Programming

Source code from Programming introduction
Python
Matplotlib
iTerm2 (pretty command line for Mac users)
Terminal tutorial (~1h)
Python Tutorial (~40 Min)
Run from command line