Dialogsteuerung am Beispiel eines Flugbuchungssystems
Diese Arbeit ist im Rahmen eines Praktikums im Modul "Human Language Technology" im Masterstudiengang Multimedia Engineering der Hochschule Wismar entstanden. Ziel ist es, einen Flug per natürlicher Sprache übers Telefon buchen zu können. Weiterhin wurde die Praxistauglichkeit der neuen SAPI (Speech API) 5.3 von Windows Vista evaluiert, zu der es zu diesem Zeitpunkt noch keine Dokumentation gab.
Zur Sprachsynthese wird die TTS-Stimme Steffi von ScanSoft benutzt. Da es sich um ein VUI (Voice User Interface) handelt, wurde auf die GUI vezichtet und nur die Konsole zur Ausgabe von Fehlern und aktuellen Programmzuständen verwandt. Die Anwendung wurde in C# programmiert und führt durch einen Mixed-Initiative-Dialog, bei dem der Nutzer die Möglichkeit hat, über natürliche Sprache gleich mehrere Slots zu füllen. Andernfalls adaptiert sich das System selbst und schaltet auf eine Fallback-Lösung um, in der es über einen systemgeführten Dialog jeden Slot einzeln abfragt. Einen groben Überblick gibt die nachfolgende Abbildung.
Um das Gespräch etwas aufzulockern, werden umgangssprachliche Äußerungen implementiert und die Form der Begrüßung variiert. Ein solcher Dialog könnte wie folgt aussehen:
Willkommen bei Buy & Fly. Wie kann ich helfen?
Guten Tag. Ich möchte morgen nach Madrid reisen; von Köln aus.
Sie möchten am 13. Juni 2008 von Köln nach Madrid fliegen. Sind diese Angaben richtig?
Jupp
Ooh, Madrid ist eine schöne Stadt...
Ich suche nun einen Flug. [Pause]
Ich habe zwei Flüge gefunden. Abflugzeit in Köln: 14 und 15 Uhr. Möchten Sie einen dieser Flüge jetzt buchen?
Ja, den Zweiten.
Ich wiederhole nun Ihre Flugdaten: Sie fliegen am 13. Juni 2008 um 15 Uhr von Köln über Paris nach Madrid. Möchten Sie diesen Flug wirklich buchen?
Jawohl
Ihr Flug wurde gebucht. Ich wünsche Ihnen viel Spaß in Madrid. Bis bald!
Leider hat Microsoft einige nicht dokumentierte Abweichungen vom SRGS (Speech Recognition Grammar Specification) Grammatikformat (semantische Rückgabewerte) vorgenommen, was recht viel Zeit kostete. Nach Überwindung dieser Hürde konnte das Projekt ohne Probleme fortgeführt werden. Trotz der kurzen Entwicklungszeit läuft das Programm sehr stabil und führt den Nutzer komfortabel durch die Flugbuchung. Microsofts Spracherkennung arbeitet dabei erstaunlich gut. Auch die Besucher der Rostocker Messe, auf der dieser Forschungs-Prototyp im Rahmen der IT-Tage 2008 präsentiert wurde, waren durchweg positiv angetan von dieser Form der telefonbasierten Kommunikation.
Kommentare
Noch keine Kommentare.
