KI-Sprachanalyse – Ein Interview mit Philipp Grochowski

Spätestens seit Veröffentlichung des Chatbots ChatGPT im November vergangenen Jahres hat die Diskussion rund um Chancen und Risiken von Künstlicher Intelligenz mächtig an Fahrt aufgenommen. Tatsächlich erleben Erforschung und Anwendungsmöglichkeiten zu Künstlicher Intelligenz zurzeit eine rasante Entwicklung. Ein Anwendungsbereich Künstlicher Intelligenz liegt in der Sprachanalyse. Sie ist Herzstück und Grundlage zahlreicher Anwendungen des auf Kundendialog und Kundenkommunikation spezialisierten Beratungsunternehmens VIER GmbH. Als Vertreter des Unternehmens konnten wir mit Herrn Philipp Grochowski, Lead Expert bei VIER Emotion Analytics. über die Chancen und Einsatzmöglichkeiten künstlicher Intelligenz in der Kundenkommunikation sprechen:

Herr Grochowski, Sie haben die Entwicklung Künstlicher Intelligenz zum Zweck der Sprachanalyse begleitet, seit diese Technologie hier in Deutschland buchstäblich aus der Taufe gehoben wurde. Seither ruft der Einsatz KI-gestützter Sprachanalyse Befürworter wie Skeptiker auf den Plan.

Erst vor wenigen Wochen machte ein Beitrag aus der Serie 11KM-der Tagesschau-Podcast Furore, in dem der Einsatz von KI-gestützter Sprachanalyse in Callcentern kritisch unter die Lupe genommen wurde. Vor diesem Hintergrund danken wir Ihnen, Herr Grochowski, für die Zeit, die Sie sich genommen haben, um aus Ihrer Erfahrung und Expertise heraus zu wichtigen Themen Stellung zu beziehen, die in diesem Podcast kritisch aufgeworfen wurden.

 

Herr Grochowski, unsere erste Frage an Sie lautet, wie zuverlässig KI-gestützte Sprachanalyse heute in der Lage ist, in Echtzeit Emotionen in Sprache zu erkennen und differenziert zu benennen.

 

Oh, das finde ich aus unterschiedlichen Gründen eine spannende Frage. Lassen Sie mich zum verbesserten allgemeinen Verständnis ein paar grundsätzliche Unterscheidungen machen und Begriffe definieren. Die von VIER entwickelte und angebotene künstliche Intelligenz “Emotion Analytics” wurde über die vergangenen 10 Jahre trainiert, um die psychologische Wirkung von Sprache, wir können auch sagen Kommunikationsstile, oder das kommunikative Verhalten, aus Sprache abzuleiten. Das zugrundeliegende psychologische Modell unterscheidet 29 kommunikative Wirkungsweisen, die alle durch Sprache vermittelt werden (können). Entsprechend hoch und ganzheitlich ist die Differenzierbarkeit von kommunikativen Verhaltensweisen. Das zugrundeliegende psychologische Modell fußt auf der größten Studie seiner Art und ist vielfach, in Wissenschaft und Praxis, validiert.

 Inwieweit diese Analyse in Echtzeit genutzt werden kann, ist vom Use-Case, den zu analysierenden Daten und der technischen Umsetzung abhängig. Die Emotion Analytics–Technologie ist via API verfügbar und kann in unterschiedlichste Prozesse und Lösungen implementiert werden.

Ich bin dafür die Einsatzmöglichkeiten und –szenarien, sowie die damit einhergehenden gewünschten Ergebnisse im Vorhinein klar zu definieren. Unser Ziel ist es mit Technologie, das Verständnis von Menschen zu verbessern und unser aller Leben einfacher zu machen. Dies gelingt unserer Erfahrung und Überzeugung nach dann besonders nachhaltig, wenn wir uns der Wirkung des eigenen Verhaltens, unserer Sprache, bewusst werden. Diese Reflektion erleichtern wir durch unsere Analysen und ermöglichen angemessenes (re)agieren. Die skizzierte Echtzeitanalyse impliziert eine Ad-hoc-Interpretation und fast sofortige Verhaltensanpassung der kommunizierenden Personen. Da ist kaum Zeit für Reflektion oder sinnhafte, gezielte Entwicklung und Verhaltensanpassung. Wir glauben nachhaltige, erfüllte und erfolgreiche Beziehungen entstehen durch eine authentische Beschäftigung mit dem Anderen, durch Zuhören und Reflektion des eigenen Verhaltens – wenn nötig und möglich mit KI-gestützten Zusatzinformationen.

Lange Rede, kurzer Sinn: Echtzeitanalyse der psychologischen Wirkung von Sprache ist technisch denkbar, der Einsatz sollte aber klar durchdacht und zum Wohle einer nachhaltig erfolgreichen und erfüllten Interaktion durchgeführt werden. Vermutlich haben auch Politiker:innen und die Gesetzgebung hier Ergänzungen – hierüber sollten wir aber separat sprechen.

 

Nicht immer nehmen wir im Alltag den emotionalen Zustand korrekt wahr, in dem sich unser Gegenüber befindet. Oftmals lassen wir uns täuschen von dem, was und wie unser Gegenüber mit uns spricht. Ist Künstliche Intelligenz hier feinfühliger, sensibler als der Mensch?

 

In einigen Bereichen ja, in anderen nein. Mir hat es immer geholfen, mir eine seriös und professionell trainierte KI wie eine:n sehr erfahrene:n Beobachter:in oder Feedbackgeber:in vorzustellen. Im Falle von VIER Emotion Analytics hat die KI auf Basis vieler Millionen von Beispielen gelernt, welche sprachlichen Parameter, Muster und Eigenarten in welcher Kombination dazu führen, dass Kommunikation einen bestimmten Effekt erzielt (oder eben auch nicht). Die KI ist also in ihrer Analyse und Bewertung die Summe sehr vieler Erfahrungen von zehntausenden von Menschen. Wenn Sie mich also Fragen, kann Emotion Analytics fairer und objektiver Aussagen darüber treffen, wie die Art und Weise wie ein Mensch kommuniziert, also verbal interagiert wahrgenommen wird, als ich, Sie oder Ihre Großmutter das kann, dann sage ich “ja”. Emotion Analytics wurde genau darauf trainiert und ist hierin präziser. Im Vergleich zu einem Menschen ist Emotion Analytics aber ungleich schlechter als der Mensch darin das Wetter vorherzusagen, oder passende Autoteile zu bestellen. Dafür wurde die KI nicht trainiert, vielleicht gibt es hierfür andere Technologien/KIs, aber solange es keine funktionierende General AI gibt, sind all diese Technologien und KIs kompetente Expert:innen in speziellen Gebieten. 

 

Wie differenziert kann Künstliche Intelligenz menschliche Emotionen in Sprache eigentlich erkennen? Kommt KI hier zum gleichen Ergebnis wie der Mensch?

 

Sehr differenziert. Das psychologische Modell umfasst 29 psychologische Wirkungsweisen und ergänzend 13 formale, statistische Ergebnisse die Sprache kategorisieren. Da Emotion Analytics mit Hilfe millionenfacher menschlicher Bewertungen („labeled data“) trainiert wurde, besteht die Qualität und der Wert der Analyse darin, dass die Ergebnisse als Feedback von zehntausenden von Menschen interpretiert werden können. Wenn ich also einen Vortrag halte, eine E-Mail verfasse, oder eine Marketingunterlage erstelle, dann kann Emotion Analytics mir Feedback geben wie meine Kommunikation typischer Weise wahrgenommen wird – welche Wirkung ich also mit ihr erziele, oder eben nicht. Die KI kommt also nicht zum gleichen Ergebnis wie “ein” Mensch, sondern wie Menschen im Durchschnitt oder typischerweise. Emotion Analytics ist vereinfacht die perfekte, objektive und fairste Feedbackgeber:in für das eigene kommunikative Verhalten. 

 

Dort, wo es gelingt, mittels KI Emotionen in der Sprache valide zu erkennen, braucht es nicht viel Fantasie, sich vorzustellen, dass KI-gestützte Sprach- bzw. Emotionserkennung speziell in Call-Centern nicht allein zur Unterstützung der Call-Center Mitarbeitenden eingesetzt wird, sondern auch zur Kontrolle. Wie sind hier Ihre Erfahrungen?

 

Die Anwendung von KI zur Emotionserkennung in Call-Centern ist in der Tat ein faszinierendes Feld und bietet ein enormes Potenzial, um die Interaktionen zwischen Kund:innen und den Mitarbeitenden im Kundenservice, aber auch im Vertriebsabteilungen von Call-Centern zu verbessern. Meine Erfahrungen zeigen, dass, wenn diese Technologie mit Bedacht und im Einklang mit ethischen Richtlinien eingesetzt wird, sie nicht nur die Effizienz und Effektivität der Services steigern kann, sondern auch dazu beiträgt, das Verständnis und die Empathie gegenüber dem Kunden zu erhöhen. Dies fördert nicht nur eine positive Arbeitsumgebung, sondern stärkt auch das Vertrauensverhältnis zwischen Kund:innen und Marke. Die natürlich vorhandene Funktion der Kontrolle sollte dabei stets konstruktiv und im Sinne einer Qualitätsverbesserung genutzt werden, anstatt als ein reines Überwachungswerkzeug. Das ist übrigens bei der Zusammenarbeit zwischen Vorgesetzten oder auch Coaches, Trainer:innen und Mitarbeitenden genauso. Ganz wichtig ist dabei 100% Transparenz, sowohl nach innen als auch nach außen, d. h. Mitarbeitende und Kunden:innen sind darüber informiert, welche Technologie wann und wie eingesetzt wird. 

 

Inwieweit ist durch die derzeit existierende Datenschutzgrundverordnung der Einsatz von KI zum Zweck der Sprachanalyse eindeutig geregelt? Ist die in dem Podcast formulierte Vermutung richtig, dass man hier im Graubereich unterwegs ist?

 

Wir sehen nicht, dass es sich um einen Graubereich handelt. Die DSGVO erwähnt Künstliche Intelligenz übrigens gar nicht explizit – aber natürlich können die durch oder mit KI umgesetzten Vorgänge durchaus in ihren Geltungsbereich fallen. Aber eins nach dem anderen, denn es geht eigentlich noch früher los – mit dem Recht auf informationelle Selbstbestimmung. Die ist ein Teil des allgemeinen Persönlichkeitsrechts aus Art. 2 Abs. 1 GG i.V.m. Art. 1 Abs. 1 GG und könnte durch den Einsatz von KI gefährdet sein. Hier gilt es, die gleiche Bewertung durchzuführen wie in allen anderen Bereichen des Einsatzes von IT-Lösungen. In der DSGO selbst sind u. a. die Artikel 5 und 22 und relevant. Gemäß Art. 5 sind bei der Datenverarbeitung bestimmte Grundsätze zu berücksichtigen (Rechtmäßigkeit, Verarbeitung nach Treu und Glauben, Transparenz, Zweckbindung, Datenminimierung, Richtigkeit, Speicherbegrenzung), die auf KI-Systeme natürlich genauso gelten. Artikel 22 gewährt Personen das Recht, sich gegen bestimmte automatisierte Entscheidungen zu entscheiden. Allerdings gibt es auch Ausnahmen, unter denen solche Entscheidungen zulässig sind. Da KI-Tools automatisierte Entscheidungen auf Basis personenbezogener Daten treffen können, ist es wichtig, dass Unternehmen vor dem Einsatz dieser Tools Artikel 22 der DSGVO genau prüfen.  

Und dann gibt es ja bald noch den EU AI Act, dieser soll künftig den Einsatz von Künstlicher Intelligenz umfassend regulieren. Die finale Fassung dieses Gesetzesentwurfs steht noch aus und wir erleben ein klares Commitment in der AI-Community und Unternehmensverantwortlichen für klare Leitlinie begleitet von Innovationsfreude und der Bereitschaft, sowie dem Wunsch den technologischen Fortschritt zum Wohle des Miteinanders nutzen zu können. 

 

Herr Grochowski, wir danken Ihnen sehr herzlich für Ihre Zeit und das Gespräch!

Share