Loading...

«Ich habe Sie leider nicht verstanden.»

Linguistische Optimierungsprinzipien für die mündliche Mensch–Maschine-Interaktion

by Evelyn Thar (Author)
©2015 Thesis 319 Pages

Summary

Sprachgesteuerte Dialogsysteme erlauben es, durch natürlichsprachliche Benutzereingaben ein automatisches System zu bedienen. Bei der telefonbasierten Mensch-Maschine-Interaktion treten durch die Kombination von zwei Kommunikationstechnologien neue Kommunikationsprobleme auf, zu deren Lösung neue Konversationsstrategien erarbeitet und alte angepasst werden müssen.
Aufgrund von empirischen Benutzeruntersuchungen mit produktiven Dialogsystemen stellt diese Studie linguistische Probleme und Konversationsstrategien dar und zeigt das veränderte Konversationsverhalten der Nutzer auf.
Auf dieser Grundlage werden linguistische Optimierungsprinzipien ausgearbeitet, die einerseits die theoretischen Erkenntnisse berücksichtigen und andererseits die Ergebnisse aus der Benutzeruntersuchung mit einbeziehen. Die linguistischen Optimierungsprinzipien zeigen, wie die mündliche Mensch-Maschine-Interaktion basierend auf der aktuellen Spracherkennungstechnologie benutzerfreundlicher und effizienter gestaltet werden kann, wenn linguistische Theorien, insbesondere gesprächsanalytische Ansätze und grundlegendes Nutzerverhalten, berücksichtigt werden.

Table Of Contents

  • Cover
  • Titel
  • Copyright
  • Autorenangaben
  • Über das Buch
  • Zitierfähigkeit des eBooks
  • Inhalt
  • 1. Einleitung
  • 1.1 Ausgangslage
  • 1.2 Zielsetzung
  • 1.3 Aufbau der Arbeit
  • I Grundlagen
  • 2. Methodische Vorgehensweise
  • 2.1 Überblick
  • 2.2 Gesprächsanalyse als Methode
  • 2.3 Empirische Untersuchung
  • 2.4 Untersuchte Dialogsysteme
  • 2.5 Zusammenfassung
  • 3. Natürlichsprachliche Dialogsysteme
  • 3.1 Überblick
  • 3.2 Definition und Einsatzgebiete
  • 3.2.1 Definition
  • 3.2.2 Einsatzgebiete
  • 3.3 Aufbau und technische Konzeption
  • 3.3.1 Aufbau eines Dialogsystems
  • 3.3.2 Spracherkennung
  • 3.3.3 Dialogsteuerung
  • 3.3.4 Sprachausgabe
  • 3.4 Voice User Interface Design
  • 3.4.1 Definition
  • 3.4.2 Dialoglogik
  • 3.4.3 Prompts
  • 3.4.4 Grammatik
  • 3.5 Zusammenfassung
  • II Theorie
  • 4. Dialogsituation im Mensch-Maschine-Kontext
  • 4.1 Überblick
  • 4.2 Linguistische Dialoganalyse der Mensch-Maschine-Interaktion
  • 4.3 Grundsätze der Mensch-Maschine-Interaktion
  • 4.4 Identität und Kompetenz des maschinellen Gesprächspartners
  • 4.5 Usability in der Mensch-Maschine-Interaktion
  • 4.6 Zusammenfassung
  • 5. Telefonische Kommunikation
  • 5.1 Überblick
  • 5.2 Linguistische Analyse der doppelten Kommunikationstechnologie
  • 5.3 Telefongespräch als Mediengesprächstyp
  • 5.4 Institutionelle Telefonate
  • 5.5 Call-Center-Gespräche
  • 5.6 Unterschied zwischen menschlichem und maschinellem Gesprächspartner
  • 5.7 Zusammenfassung
  • III Empirie
  • 6. Nutzerseitiges Gesprächsverhalten
  • 6.1 Überblick
  • 6.2 Generelles Benutzerverhalten
  • 6.2.1 Allgemeine Gesprächsstrategien
  • 6.2.2 Syntaktischer Aufbau der Benutzereingaben
  • 6.2.3 Zeitpunkt der Benutzereingaben
  • 6.3 Benutzererwartungen
  • 6.3.1 Benutzererwartungen bezüglich Vokabular
  • 6.3.2 Systemverhalten widerspricht den Benutzererwartungen
  • 6.3.3 Dialogsystem als Instrument oder Gesprächspartner
  • 6.4 Benutzerklassifikation
  • 6.4.1 Klassifikation aufgrund persönlicher Merkmale
  • 6.4.2 Klassifikation aufgrund des Gesprächsverhaltens
  • 6.5 Zusammenfassung
  • 7. Interaktionsphänomene
  • 7.1 Überblick
  • 7.2 Allgemeine Beobachtungen
  • 7.2.1 Interaktionsschwierigkeiten aufgrund der maschinellen Interaktion
  • 7.2.2 Moduswechsel
  • 7.3 Gesprächsorganisation
  • 7.3.1 Sprecherwechsel
  • 7.3.2 Gesprächsphasen
  • 7.4 Rezipientensignale
  • 7.4.1 Verstehens- und Höflichkeitssignale
  • 7.4.2 Metakommunikative Benutzeräusserungen
  • 7.5 Reparaturen
  • 7.5.1 Benutzerseitige Reparaturen
  • 7.5.2 Systemseitige Reparaturen
  • 7.6 Zusammenfassung
  • 8. Optimiertes Systemdesign
  • 8.1 Überblick
  • 8.2 Nutzeradaption
  • 8.2.1 Gesprächsstrategien erkennen und nutzen
  • 8.2.2 Benutzererwartungen erfüllen
  • 8.2.3 Bestimmungsmerkmale berücksichtigen
  • 8.3 Systemanforderung
  • 8.3.1 Gespräch organisieren
  • 8.3.2 Rezipientensignale einplanen
  • 8.3.3 Reparaturen ermöglichen
  • 8.4 Dialogsituation
  • 8.4.1 Mensch-Maschine-Interaktion beachten
  • 8.4.2 Gesprächssorte bestimmen
  • 8.5 Zusammenfassung
  • 9. Fazit
  • 9.1 Optimierungsprinzipien für sprachgesteuerte Dialogsysteme
  • 9.2 Ausblick
  • Anhang
  • Bibliographie
  • Reihenübersicht

← 10 | 11 →1. Einleitung

1.1 Ausgangslage

Wie sprechen Menschen mit einem Computer oder einer Maschine? Wie sprechen wir den Computer an? Welche Gesprächsstrategien werden angewendet und worauf stützen sich diese ab? Was passiert, wenn der Computer uns nicht versteht?

Diesen Fragen möchte die vorliegende Arbeit aufgrund der Untersuchung von aktuellen, kommerziell eingesetzten, sprachgesteuerten Dialogsystemen nachgehen.

Sprachgesteuerte Dialogsysteme bilden eine Benutzerschnittstelle zwischen Mensch und Maschine, deren Zugang über die natürliche Sprache erfolgt. Grundsätzlich kann die Interaktion zwischen Mensch und Maschine über verschiedene Benutzerschnittstellen stattfinden. Von der Chat-Kommunikation bis zur Robotersteuerung, um nur zwei Beispiele zu nennen, existieren sowohl schriftliche wie auch gesprochene Kommunikationsformen. Eine Benutzerschnittstelle, die gesprochene Benutzereingaben zulässt, kann wiederum sehr unterschiedlich gestaltet sein: Das Spektrum der möglichen Eingabeformen erstreckt sich von Einzelwort-Kommandos bis zu natürlichsprachlichen Eingaben von ganzen Sätzen. Demgegenüber kann eine schriftliche Benutzerschnittstelle durch einen Touchscreen oder Tastatureingaben gestaltet sein oder – wie in der Chat-Kommunikation – frei formulierte Eingaben zulassen.

Sprachgesteuerte Benutzerschnittstellen wurden bis anhin vor allem im beruflichen Umfeld eingesetzt, wie beispielsweise in der Medizin als Diktier- und Steuerungsgeräte während Operationen. Durch die verbesserte Spracherkennung ist die Sprachsteuerung unterdessen auch im privaten Bereich verbreitet. Wir sind es gewohnt, mit dem Navigationsgerät im Auto zu sprechen oder nutzen die Sprachsteuerung des Mobiltelefons. Gerade die Sprachsteuerung des Mobiltelefons erfreut sich immer grösserer Beliebtheit, wie eine Studie zu Voice Search von Google1 zeigt. ← 11 | 12 →Gemäss der Studie nutzen gerade Jugendliche vermehrt die Möglichkeit der Sprachsteuerung.

Die natürlichsprachlichen Dialogsysteme, die als Untersuchungsgegenstand für diese Arbeit dienten, stellen eine gesprochene Benutzerschnittstelle dar, die über einen telefonischen Zugang hergestellt wird. Diese Art von telefonbasierten Dialogsystemen wird zur Unterstützung des Telefonkanals in der Kundenkommunikation eingesetzt und ist unterdessen weit verbreitet. Kunden sind es heutzutage gewohnt, ein automatisches System anzutreffen, wenn sie den Kundenservice eines Dienstleistungsunternehmens anrufen. Diese Telefonsysteme können einen sehr kurzen Dialog umfassen, bei dem nur die gewünschte Sprache gewählt wird oder der Anrufer sein Anliegen einer der angebotenen Menüoptionen zuordnen muss, bevor der Anruf in ein Call-Center weitergeleitet wird. Die automatisierte Interaktion kann sich jedoch auch über mehrere Minuten hinziehen, falls es sich um ein Transaktionssystem wie eine Fahrplanauskunft oder ein Banktransaktionssystem handelt.

Zudem kann der Eingabemodus variieren: Bei einem tastaturgesteuerten System wird die Wahl der gewünschten Option über das Drücken einer Taste auf der Telefontastatur ausgelöst. Die sprachgesteuerten Systeme hingegen, die in dieser Arbeit untersucht werden, reagieren auf sprachliche Äusserungen der Benutzer,2 der Anrufer spricht also mit dem automatischen Dialogsystem.3

Ob wir per Telefon, im Auto oder direkt mit unserem Mobiltelefon sprechen, spielt für das Ziel dieser Arbeit letztlich eine untergeordnete Rolle. Der Fokus der Arbeit liegt darauf, mittels empirischer Untersuchung zu analysieren, wie wir mit einem Computer sprechen, und daraus Optimierungsprinzipien für ein verbessertes Systemdesign abzuleiten.

← 12 | 13 →1.2 Zielsetzung

Die Analyse des Korpus soll neben den Antworten auf die anfangs gestellten Fragen auch die Grundlage für weiterführende Überlegungen liefern. Neben der Darstellung der linguistischen Probleme und des Konversationsverhaltens der Nutzer sollen Empfehlungen für eine optimierte Dialogstrategie ausgearbeitet werden, welche einerseits die linguistische Theorie berücksichtigt und andererseits die Analysen aus der Benutzeruntersuchung einbezieht. Diese optimierte Dialogstrategie soll Vermeidungs- und Lösungsstrategien auf der Systemseite beinhalten, wobei diese nicht auf der Ebene der Spracherkennung und -synthese ansetzen. Es handelt sich dabei vielmehr um gesprächsanalytische Lösungsansätze, die auf Dialogebene einfliessen, zu einem optimierten Systemdesign führen und somit eine intuitivere Interaktion mit dem Dialogsystem ermöglichen. Die Empfehlungen für eine optimierte Dialogstrategie werden in acht Optimierungsprinzipien zusammengefasst, die als konkrete Anleitungen für die Gestaltung von sprachgesteuerten Dialogsystemen zu verstehen sind.

Das Ziel der Arbeit liegt darin, aufzuzeigen, wie mit der heute vorhandenen Technologie benutzerfreundliche und effiziente Dialogsysteme erstellt werden können, wenn linguistische Theorien, insbesondere gesprächsanalytische Ansätze und die grundlegenden Verhaltensmuster aus dem untersuchten Benutzerverhalten, berücksichtigt werden.

1.3 Aufbau der Arbeit

Die Arbeit besteht aus drei Teilen: Im ersten Teil werden die Grundlagen besprochen. Die methodische Vorgehensweise wird vorgestellt, was sowohl die gesprächsanalytische Methode als auch die Eckdaten der empirischen Untersuchung und der Korpuserstellung umfasst. In diesem Teil wird zudem der eigentliche Untersuchungsgegenstand beschrieben, indem ein Überblick über natürlichsprachliche Dialogsysteme gegeben wird, der den Aufbau, die technische Konzeption und verschiedene weitere Aspekte wie das Voice User Interface Design einschliesst.

← 13 | 14 →Der zweite Teil der vorliegenden Arbeit beschäftigt sich mit theoretischen Ansätzen. Das telefonbasierte Dialogsystem wird nicht nur unter dem Gesichtspunkt der Mensch-Maschine-Interaktion untersucht – auch die telefonische Kommunikationssituation fliesst in die theoretischen Überlegungen mit ein.

Aufgrund des maschinellen Gesprächspartners sind Untersuchungen aus dem Feld der Mensch-Maschine-Interaktion von Interesse. Dabei wird eine linguistische Dialoganalyse vorgenommen, Grundsätze aus der Mensch-Maschine-Interaktion werden vorgestellt und weitere relevante Gebiete wie die Benutzerfreundlichkeit (Usability) werden diskutiert. Die Kommunikationskompetenz, die sich Anrufer aufgrund des Mediengesprächstyps Telefon angeeignet haben, wird ebenfalls in diesem Teil beschrieben. Die doppelte Kommunikationstechnologie, die sich durch das Medium Telefon und den maschinellen Gesprächspartner ergibt, wird in Bezug auf ihre Auswirkungen sowie auf die dadurch auftretenden Anforderungen für die Gesprächsteilnehmer untersucht.

Im dritten Teil schliesslich geht es um die Empirie. Die in der empirischen Untersuchung aufgetretenen Phänomene werden unter verschiedenen Gesichtspunkten analysiert. In Kapitel sechs werden die Phänomene aus Sicht der Benutzer präsentiert. Kapitel sieben konzentriert sich auf die Untersuchung der Interaktionsphänomene und umfasst nicht nur Interaktionsschwierigkeiten und Reparaturen, sondern auch gesprächsanalytische Untersuchungsgegenstände wie Sprecherwechsel oder Rezipientensignale.

Die Arbeit soll jedoch nicht mit der Analyse der aufgetretenen Phänomene enden. Ziel ist es, einen Schritt weiter zu gehen und die Ergebnisse der Analyse in die Gestaltung von optimierten Dialogsystemen einfliessen zu lassen. Aufgrund der Analyse der aufgetretenen Kommunikationsprobleme und des theoretischen linguistischen Wissens soll eine Anleitung für eine systemseitige Dialogstrategie erstellt werden, die zu einer erfolgreich(er)en Interaktion mit einem automatischen Dialogsystem führt.

________

1 http://googleblog.blogspot.de/2014/10/omg-mobile-voice-survey-reveals-teens.html, zitiert am 28.11.2014.

2 Im Sinne der Lesefreundlichkeit wird in dieser Arbeit bei Personenbezeichnungen, sofern sie als sprachliche Instanzen und konventionalisierte Kategorien auftreten, das generische Maskulinum verwendet (Benutzer, Anrufer usw.). Bei allen anderen Personenbezeichnungen werden entweder Paarformen, bei denen sowohl die weibliche als auch die männliche Form genannt wird, oder geschlechtsabstrakte Begriffe verwendet (Testperson).

3 Als natürlichsprachlich gelten tastatur- und sprachgesteuerte Systeme, da sich natürlichsprachlich auf die Systemausgabe bezieht, die in natürlicher Sprache erfolgt. Bei den untersuchten Dialogsystemen wird die Eingabe über die Sprache ausgeführt, sie wird jedoch bei den meisten Systemen durch eine tastaturgesteuerte Eingabemöglichkeit ergänzt (vor allem für die Nummerneingabe).

← 16 | 17 →2. Methodische Vorgehensweise

2.1 Überblick

Dieses Kapitel widmet sich den theoretischen Grundlagen und der methodischen Vorgehensweise. In einem ersten Schritt wird die Gesprächsanalyse als Methode vorgestellt, danach werden das Vorgehen der Datensammlung und die Parameter der empirischen Untersuchung beschrieben.

Untersucht werden die Gespräche mithilfe der Gesprächsanalyse. Gesprächsanalyse wird in der vorliegenden Arbeit im Sinne der Ethnomethodologischen Konversationsanalyse verwendet, die auf die amerikanische conversational analysis zurückgeht.1 Brinker und Sager formulieren den Fokus der conversational analysis folgendermassen:

Im Vordergrund des Forschungsinteresses der ‚conversational analysis‘ stehen allerdings nicht die sprachlichen Einheiten und Strukturen, sondern es geht primär um den Versuch einer Rekonstruktion der in Gesprächen ablaufenden Prozesse der Bedeutungszuschreibung und Interpretation sowie der für solche Vorgänge grundlegenden Interaktions-bedingungen. (Brinker/Sager 2010: 16f.)2

Die gesprächsanalytische Untersuchung soll Aufschluss darüber geben, wie mit natürlichsprachlichen Dialogsystemen im Alltag umgegangen wird und welche Faktoren das Gespräch mit dem maschinellen Gesprächspartner erfolgreich verlaufen oder scheitern lassen.

Um mit dem maschinellen Gesprächspartner zu interagieren, greifen die menschlichen Kommunikationsteilnehmer auf eine bereits vorhandene Gesprächskompetenz zurück oder erarbeiten sich ein neues Regelwerk für die Interaktion mit diesem. Ob diese Regeln neu erlernt werden müssen ← 17 | 18 →und – sofern auf bestehende Regeln zurückgegriffen wird – woher diese Regeln stammen, wird mithilfe der gesprächsanalytischen Untersuchung aufgezeigt.

Die Untersuchung basiert auf Gesprächsaufnahmen mit kommerziell eingesetzten Dialogsystemen. Dabei wurde darauf geachtet, dass sowohl die Auswahl der Dialogsysteme als auch die Auswahl der Testpersonen möglichst vielfältig ausfällt. Die Dialogsysteme stammen deshalb aus verschiedenen Branchen und weisen unterschiedliche Dialogstrukturen auf.

Die Testpersonen sind zwischen 20 und 66 Jahre alt, je zur Hälfte männlichen und weiblichen Geschlechts und unterscheiden sich im Bildungsstand sowie bezüglich der technischen Vorkenntnisse.

2.2 Gesprächsanalyse als Methode

Die Interaktion mit den natürlichsprachlichen Dialogsystemen wird mithilfe der Gesprächsanalyse untersucht. Was mit Gesprächsanalyse gemeint ist und wieso gerade sie sich als Untersuchungsmethode eignet, sei mit folgendem Zitat erklärt:

Wofür interessiert sich die Gesprächsanalyse? Sie will wissen, wie Menschen Gespräche führen. Sie untersucht, nach welchen Prinzipien und mit welchen sprachlichen und anderen kommunikativen Ressourcen Menschen ihren Austausch gestalten und dabei die Wirklichkeit, in der sie leben, herstellen. Diese Gesprächswirklichkeit wird von den Gesprächsteilnehmern konstituiert, d. h., sie benutzen systematische und meist routinierte Gesprächspraktiken, mit denen sie im Gespräch Sinn herstellen und seinen Verlauf organisieren. (Deppermann 2008: 9)

Damit ist auch das Ziel dieser Arbeit beschrieben: zu analysieren, wie Menschen am Telefon mit einem Computer sprechen. Wird der Computer als Gesprächspartner akzeptiert? Wie wird das maschinelle Gegenüber angesprochen? Werden eher telefonische Gesprächsstrategien oder solche der Mensch-Maschine-Interaktion eingesetzt? Wer übernimmt die Gesprächsorganisation? Verhalten sich die Benutzer kooperativ? Was passiert, wenn der Computer einen nicht versteht? Welche Strategien wenden die Benutzer an, wenn die Maschine nicht wie gewünscht reagiert?

Details

Pages
319
Publication Year
2015
ISBN (PDF)
9783035108347
ISBN (MOBI)
9783035193169
ISBN (ePUB)
9783035193176
ISBN (Softcover)
9783034316828
DOI
10.3726/978-3-0351-0834-7
Language
German
Publication date
2015 (July)
Keywords
Voice-User Interface Spracherkennungstechnologie Siri Voice Activation System Mensch-Maschine Interaktion
Published
Bern, Berlin, Bruxelles, Frankfurt am Main, New York, Oxford, Wien, 2015. 319 S., 8 s/w Abb., 18 Tab., 10 Graf.

Biographical notes

Evelyn Thar (Author)

Evelyn Thar studierte Germanistik, Computerlinguistik und Filmwissenschaft an der Universität Zürich. Danach war sie in der IT-Branche tätig als Voice-User-Interface-Designer, Senior Consultant im Bereich Speech Technology und Projektleiterin für internationale Software-Projekte. Heute ist sie Geschäftsführerin einer Beratungsfirma für Online-Marketing in den Bereichen Suchmaschinenoptimierung, Suchmaschinenmarketing und Web-Analyse.

Previous

Title: «Ich habe Sie leider nicht verstanden.»