Erik Bouwer van Klantcontact in gesprek met de voice experts Nadine Glas en Michel Boedeltje over voicebots in customer service met taal en spraaktechnologie en kunstmatige intelligentie.
Michel Boedeltje is product owner bij Telecats. “Als ik niet werk, dan fiets ik”. Op de planning voor september 2021: Tour for Life, een fundraisingtocht van Italië naar Nederland. Dat is 1.300 kilometer in 8 dagen en 19.000 hoogtemeters.”
Nadine Glas geeft leiding aan het Speech Lab. Ze houdt van dansen en spreekt graag af met vrienden. “Haha, voor mij geen afzien in de bergen.”
Waar kom je vandaan en hoe ben je in de spraaktechnologie terecht gekomen?
Nadine: Ik kom oorspronkelijk uit een klein dorpje in Drenthe (Diever) en ben op mijn 17e gaan studeren in de grote stad Groningen. Ik begon met een studie Communicatie, maar dat vond ik te vaag – of te weinig exact zoals je wilt. Daarom heb ik gesolliciteerd naar een plek binnen een internationale master, Language & Communication Technologies, gedeeltelijk in Nancy, Frankrijk. In die studie slaat computer science een brug tussen exacte vakken en taalkunde. Na mijn studie heb ik in Parijs eerst voor het LIMSI lab gewerkt en daarna voor een Frans bedrijf op het vlak van R&D en computational linguistics. Aansluitend ben ik gepromoveerd in human-computer interaction aan de grand école Télécom ParisTech. Na zes jaar Frankrijk ben ik teruggegaan naar Nederland. Ik kende meer Franse dan Nederlandse bedrijven, maar als je online vacatures zoekt kom je toch snel uit bij Telecats. Dat was een aangename verrassing: het paste precies.
Michel: Mijn achtergrond is wat minder internationaal dan die van Nadine, maar verder zijn er wel parallellen: opgegroeid in Groningen en ook op zoek naar een technische studie. In Enschede heb ik technische informatica gedaan. Pas verderop in de studie raakte ik gefascineerd door taal- en spraaktechnologie en ben afgestudeerd in ‘human media interaction’. Daarin was veel aandacht voor de opbouw en werking van taal en spraak, dus dat maakte de informatica weer wat minder technisch en wiskundig (hoewel daar nog steeds voldoende aandacht voor was). Ik liep in 2003 stage bij Arjan van Hessen – vroeg of laat komt hij bij iedereen die iets met taal- en spraaktechnologie op het pad. Ook zijn colleges zijn goed blijven hangen. Via Arjan kwam ik ook bij Telecats uit.
Nadine: Telecats was op zoek naar iemand die de intent-herkenning verder kon optimaliseren. Ik ben begonnen bij het analyseren van de algoritmen. Ik heb voor specifieke toepassingen nieuwe algoritmen geïntroduceerd. Dan gaat het om situaties waarbij niet alleen het onderwerp, maar ook heel specifieke woordcombinaties belangrijk zijn om het onderwerp van een vraag goed te kunnen bepalen. Bij de Consumentenbond bijvoorbeeld is het onderscheid tussen “Ik bel over een factuur” of “ik bel over mijn factuur” essentieel. Als voor een goed begrip van taal een subtiel onderscheid nodig is, heb je ook subtiele algoritmen nodig.
Wat is jullie rol en wat zijn de uitdagingen?
Nadine: Binnen het nieuwe Speech Lab van Telecats waar ik leiding aan geef, werken we aan modellen die nodig zijn voor producten waar Michel de product owner van is. Telecats leverde altijd maatwerkoplossingen voor klanten, maar ook onze modellen die daarbij gebruikt worden, zullen we omzetten in producten – denk aan specifieke oplossingen voor sectoren.
Michel: Daarnaast gaan we ook het aantal talen waarin Telecats werkt, naast Nederlands, Vlaams, Engels en Frans uitbreiden met in eerste instantie Duits en Spaans en later ook andere talen. Met de maatwerkoplossingen realiseerde Telecats altijd een heel hoge kwaliteit. Nu is het de uitdaging om de door ons ontwikkelde toepassingen zo te standaardiseren dat we ze kunnen uitrollen in verschillende sectoren. Onze spraakrouteringsoplossing werkt nu voor alle mogelijke klanten, waarbij er modules zijn waarin we het maatwerk realiseren – denk aan het integreren met bestaande applicaties en het trainen van de oplossing op specifiek jargon van een bedrijf. Een andere uitdaging is dat we de taal- en spraaktechnologie beschikbaar willen maken voor eindgebruikers in de business, waarbij ze zelf heel veel kunnen configureren. Als je een dialoog kunt uittekenen, kan je deze ook inrichten in de oplossing – met drag & drop. Eenvoud aan de voorkant en alle complexiteit aan de achterkant, dat is een van onze uitdagingen nu.
Nadine: Dat wil dus niet zeggen dat we overal dezelfde spraakherkenner neerzetten of generieke modellen gaan gebruiken. We streven ernaar om modellen gemakkelijker toe te passen in nieuwe situaties of talen, wat de implementatiesnelheid vergroot. Mijn uitdaging binnen Speech Lab is het trainen van de software.
Waar willen jullie over twee tot drie jaar staan?
Michel: We zijn nu vooral druk bezig met de ontwikkeling van ons portfolio, denk aan producten die gericht zijn op het telefoonverkeer in de frontoffice te stroomlijnen en aan de achterkant te analyseren. Aan de achterkant werken we bijvoorbeeld hard aan het geautomatiseerd genereren van samenvattingen van gesprekken. De volgende stap is ook om slimme toepassingen op het tussenstadium los te laten. Denk aan real time agent assist. Daarnaast ligt er een uitdaging om dialogen niet meer te programmeren, maar geautomatiseerd tot stand te laten komen op basis van input die een systeem krijgt. Een toepassing kan dan zelf de volgende vraag formuleren om een doel te bereiken. Misschien is twee of drie jaar te weinig.
Nadine: Dan zijn we verder met spraakherkenning in verschillende vreemde talen. Dat is een voorwaarde voor onze internationalisering. We hebben bewezen dat we het voor het Nederlands goed kunnen; andere talen leveren weer andere uitdagingen op. Los van de taal- en spraaktechnologie gaat het ook om het inspelen op de andere behoeften van buitenlandse bedrijven en de manier waarop buitenlandse bedrijven omgaan met klanten. Momenteel werk ik weer in het Frans samen met onze Franse klanten. We hebben al Nederlandse (inclusief Vlaams), Franse en Engelse spraakherkenning die we nog aan het optimaliseren zijn daar komen allerlei talen bij te beginnen met Duits en Spaans.
Wat ik ook zie aankomen is een grote vooruitgang, niet alleen op het gebied van spraakherkenning, maar ook wat betreft de verwerking van het geluidssignaal zelf (de stiltes, de toonhoogte enz.) om niet alleen te interpreteren wat er wordt gezegd, maar ook hoe het wordt gezegd. Dit zal organisaties helpen om nog verder te gaan in het begrijpen van hun klanten en veel nieuwe mogelijkheden bieden.
Tekst: Erik Bouwer, Klantcontact.nl