We kunnen als onderzoekers Taal- en Spraaktechnologie steeds beter emoties in spraak detecteren. De basisemoties angst, woede, blijdschap zijn ongeveer hetzelfde in alle culturen en daarom goed te detecteren met een software-analyse. Het is lastiger om zaken als ironie en sarcasme te detecteren deze zijn subtieler en verschillen meer per cultuur.
Onderzoek naar emotie in spraak
Arjan van Hessen van de Universiteit Twente: naast het analyseren van het geluidsignaal, kunnen we ook herkennen wat er gezegd wordt: spraakherkenning. We weten op die manier wat er gezegd wordt en hoe het gezegd wordt. Zo kunnen we ook zien hoe lang mensen pauzeren voor ze het volgende woord uitspreken. Dit “wat” en “hoe” gebruiken we op dit moment in een onderzoek samen met het AMC en UMC. Bij het AMC willen ze weten of een behandeling van PTSS aanslaat. Door de spraak van iemand die voor PTSS behandeld wordt, steeds op dezelfde manier te analyseren, kun je zien of een behandeling effect heeft. Als het goed is, gaat iemand steeds makkelijker over de traumatische gebeurtenis spreken en zullen de pauzes tussen de woorden dus kleiner worden. Zo iemand gaat dus steeds vlotter praten over die gebeurtenis. Dat kunnen we goed meten.
Bij het UMC doen we iets vergelijkbaars. We helpen de PhD-student met haar onderzoek naar de spraak van jong-volwassenen die een psychose hebben gehad. Een goede psychiater hoort hoe het met zo iemand gaat, maar wat is dat? Is het het woordgebruik, de manier van spreken of een combinatie van deze twee? Ook hier proberen we erachter te komen door te kijken naar “wat” iemand zegt en “hoe” die dat zegt.
Spraakanalyse met emotie in het contact center
Bij Telecats ontwikkelen we spraaktechnologie voor contact centers. Steeds vaker krijgen we de vraag: kunnen jullie ook iets zeggen over “emotie” van de beller? Zijn onze klanten tevreden na afloop van het gesprek of niet? En kunnen jullie aangeven of het tijdens het gesprek tussen klant en contact center medewerker goed gaat of dat iemand moet ingrijpen? Ook hier kijken we naar “wat” iemand zegt en “hoe” die dat zegt. Als het uit de hand dreigt te gaan lopen dan zien we dat mensen elkaar niet meer laten uitspreken en dus door elkaar heen gaan spreken. Ook gaan ze harder praten en gaan ze bepaalde woorden gebruiken.
Meten klanttevredenheid
Met de combinatie van al deze meetgegevens kunnen we dan vrij nauwkeurig aangeven dat het gesprek dreigt te ontsporen. Dezelfde aanpak gebruiken we om te bepalen of beller “tevreden” zijn of juist niet. Heel makkelijk is dit niet, maar het blijkt dat het gemiddelde dat de computer berekent en dat wat mensen berekenen niet veel uit elkaar ligt. Het zegt dus iets (maar niet alles). Wat we nog niet kunnen herkennen is zaken als sarcasme of ironie.