Skip to ContentSkip to Navigation
Over ons Actueel Nieuws

Meer dan 'Hey Siri': op weg naar inclusieve spraaktechnologie

24 maart 2025
decoratieve afbeelding
Matt Coler

Veel mensen zijn al wel op de een of andere manier met spraaktechnologie in aanraking gekomen. Maar stel je eens een wereld voor waarin spraaktechnologie niet alleen betekent dat je je slimme speaker naar het weer vraagt, maar waarbij je spraaktechnologie kunt inzetten om mensen met een spraakstoornis een stem te geven, bedreigde talen kunt ondersteunen en die zelfs sarcasme kan begrijpen? Dit is wat Matt Coler en zijn team aan het verkennen zijn binnen het Engelstalige masterprogramma Speech Technology (Spraaktechnologie) dat gegeven wordt op Campus Fryslân.

Tekst: Froukje Duursema, Corporate Communicatie RUG / Foto Coler: Piet Douma

Beperkingen van de technologie

‘Ik raakte via een ongebruikelijke weg geïnteresseerd in spraaktechnologie,’ geeft Coler toe. ‘Mijn promotieonderzoek is eigenlijk gericht op de documentatie van kleine talen.’ Toen hij hier veldwerk voor deed, liep Coler al snel tegen de beperkingen van de technologie aan. ‘Ik deed onderzoek in Zuid-Amerika, waar ik met inheemse bevolkingsgroepen werkte en opnameapparatuur gebruikte om hun taal op te nemen. Maar als je de taal waar je naar luistert niet spreekt, herken je de woordgrenzen niet.’ Coler legt uit dat het daarom een uitdaging was om erachter te komen waar de woorden begonnen en ophielden. En zijn transcriptiesoftware kon er ook geen touw aan vastknopen.

‘Dit riep allerlei vragen bij mij op, het aantal mogelijke spraakklanken is immers beperkt. Toch is er geen technologische oplossing voorhanden om transcripties te maken die de werkelijke taal ook maar benaderen. Als iemand die zich bezig heeft gehouden met veel minder bekende talen, vroeg ik me af waarom spraaktechnologie niet werkt, zelfs niet voor een veelvoorkomende taal als Engels?’

Een lastige klus

Coler legt uit dat spraaktechnologie uit twee componenten bestaat: spraaksynthese en spraakherkenning. Spraaksynthese verwijst naar de manier waarop machines kunstmatige taal produceren en spraakherkenning gaat over het vermogen van onze technologie om spraak te herkennen. ‘Als je Alexa of Google Home apparaat met je praat, beschouw je dat misschien als iets heel vanzelfsprekends omdat het apparaat waarschijnlijk een grote taal zoals het Engels spreekt. Maar het is eigenlijk een grote uitdaging om een stem te creëren die lijkt op een menselijke stem, vooral een stem die melodieus klinkt.’ Coler vermeldt ook andere noemenswaardige uitdagingen die zich voordoen bij spraakherkenning: ‘Het is moeilijk om precies de juiste spraaksignalen uit een luidruchtige achtergrond te filteren, vooral omdat er zo veel verschillende achtergronden zijn: stemmen, dierengeluiden, of allerlei andere achtergrondgeluiden. Als je dit met kleinere talen wil doen, is zoiets een nog grotere uitdaging.’

decoratieve afbeelding
‘Spraaktechnologie heeft de potentie om ons begrip van technologische inclusiviteit te beïnvloeden. Ik denk dat technologie op z’n best is wanneer het je leven verbetert.'

Wat is het doel ervan?

Coler blijft zich richten op bredere toepassingen, maar hij erkent ook de indrukwekkende vooruitgang die geboekt is door grote techbedrijven. Bijvoorbeeld ChatGPT, transcriptiediensten, of applicaties zoals DuoLingo. Hij zegt dat je jezelf moet afvragen wat het belangrijkste doel is van een applicatie of apparaat: het leven van mensen verbeteren of een product verkopen. ‘Spraaktechnologie heeft de potentie om ons begrip van technologische inclusiviteit te beïnvloeden. Ik denk dat technologie op z’n best is wanneer het je leven verbetert.' Coler legt uit dat de markt momenteel gedomineerd wordt door een paar uiterst monopolistische bedrijven, die het doen voorkomen alsof de beperkingen van technologie worden bepaald door wat verkoopt. Wetenschappers hebben echter een ander doel: de levenskwaliteit verbeteren voor de mens. ‘De focus ligt veel meer op wie voordeel kan halen uit een applicatie of apparaat.’

Een andere kijk op spraakassistentie

Een goed voorbeeld van een marktkans met een zeer grote maatschappelijke impact, is een recent onderzoeksproject dat Coler heeft begeleid. We hadden een promovendus die werkte aan het verbeteren van spraakherkenning voor mensen met een spraakstoornis veroorzaakt door een neurodegeneratieve ziekte zoals de ziekte van Parkinson. Veel mensen kunnen door een ziekte of beperking niet vloeiend spreken, bijvoorbeeld mensen die herstellen van keelkanker of mensen met een hersenverlamming. ‘Veel van deze mensen spreken op een manier die niet makkelijk te begrijpen is voor apparaten, en vaak ook niet voor de mensen om hen heen,’ legt Coler uit. ‘Stel je voor dat je voor al deze mensen een apparaat zou kunnen ontwikkelen met persoonlijke spraakherkenning, aangezien iedere ziekte op een andere manier tot uiting komt. Deze technologie zou dan hun spraak naar een synthetische stem converteren of naar tekst transcriberen. Zulke ontwikkelingen kunnen het leven van mensen met spraakproblemen in positieve zin veranderen, omdat ze makkelijker kunnen communiceren—of ze nu iets bestellen in een restaurant, telefoneren, of een gesprekje voeren. Juist dit is waar universiteiten op zouden moeten inzetten,’ benadrukt Coler.

Het behoud van het Fries en andere minderheidstalen

Coler en zijn team werken ook aan een manier om het Fries te gebruiken bij interactie met apparaten. Hij pleit ervoor om kleinere talen onderdeel te maken van het digitale landschap, aangezien dit nieuwe mogelijkheden kan bieden voor interacties tussen mens en machine. ‘Als jongeren met hun apparaat het digitale landschap betreden en zich realiseren dat ze geen Fries kunnen dicteren naar hun telefoon, zullen ze misschien de taal helemaal niet meer gebruiken. Het is waarschijnlijk gemakkelijker om in het Engels of het Nederlands te dicteren. Het Engels is vaak de impliciete taal van moderne interacties met onze computers.’ Coler benadrukt dat gratis taaltools die Fries begrijpen, de drempel om Fries te spreken zouden kunnen verlagen, zelfs voor mensen die de taal niet vloeiend spreken. Hij licht toe hoe je thuis Fries zou kunnen oefenen door middel van spraaktechnologie: ‘Als je geen vloeiend Fries spreekt, voel je je misschien ongemakkelijk om Fries te praten. Stel je voor dat je thuis aan het oefenen bent, en het maakt het apparaat niet uit of je woorden verkeerd uitspreekt. Daardoor voel je je misschien meer op je gemak om de taal eens te gebruiken. Ik denk dat de beschikbaarheid van tools die de taal impliciet erkennen, met zich meebrengt dat de taal hetzelfde prestige heeft als elke andere taal. Tot voor kort was spraaktechnologie enkel beschikbaar voor de meest gesproken talen, die met de meeste middelen.’

decoratieve afbeelding
Ander recent promotieonderzoek dat Coler begeleidde, ging over de ontwikkeling van een sarcasme-detector. ‘We slaagden erin om een detector te ontwikkelen die in staat was om sarcasme te herkennen; in ongeveer 75% van de gevallen had de detector gelijk.'

Een computer die sarcasme herkent

Ander recent promotieonderzoek dat Coler begeleidde, ging over de ontwikkeling van een sarcasme-detector. Hij wijst erop dat we nu heel letterlijk met onze apparaten communiceren. ‘Wanneer je apparaat je foute informatie geeft en daarna netjes vraagt “Was dit behulpzaam?”, wordt een antwoord als “Jaaa dat was sùper behulpzaam,” letterlijk begrepen, ook al zouden de meeste sprekers het sarcasme meteen herkennen.’ Coler zegt dat het doel niet is om een betere Siri of Alexa te ontwikkelen, maar om mensen de mogelijkheid te geven om op een natuurlijkere manier om te gaan met hun apparaten. ‘Veel van wat we zeggen is beeldspraak of sarcasme. Het gaat er niet om wat je zegt, maar hoe je het zegt.’ Belangrijke aspecten van menselijke spraak zoals oprechtheid, emotionele lading en inhoud, worden tot uiting gebracht door melodie.

‘We slaagden erin om een detector te ontwikkelen die in staat was om sarcasme te herkennen; in ongeveer 75% van de gevallen had de detector gelijk. Daarmee scoort de detector misschien nog wel beter dan een mens, want die zit er ook nog wel eens naast.’

Buiten de gebaande paden

Coler erkent de indrukwekkende vooruitgang die grote techbedrijven hebben gemaakt, maar blijft zich richten op bredere toepassingen. ‘Recente ontwikkelingen zoals OpenAI’s Whisper hebben het onderzoeksgebied zeker veranderd. Maar commerciële innovaties zijn slechts een deel van het verhaal.’ Campus Fryslân blijft erop toezien dat deze geavanceerde technologieën de behoeften dienen van verschillende gemeenschappen. ‘De vraag is niet alleen wat spraaktechnologie kan, maar ook wie het kan dienen en hoe het levens kan verbeteren.’

Meer informatie

Laatst gewijzigd:27 maart 2025 08:45
Deel dit Facebook LinkedIn
View this page in: English

Meer nieuws

  • 05 maart 2025

    Vrouwen in de wetenschap

    De RUG viert Internationale Vrouwendag met een bijzondere fotoserie: Vrouwen in de wetenschap.

  • 19 december 2024

    RUG heeft weer beste bacheloropleiding in Nederland

    De RUG-opleiding Global Responsibility and Leadership is volgens de Keuzegids Universiteiten 2025 de beste bacheloropleiding van Nederland. Dat is al voor het vierde jaar op rij. De opleiding, die gegeven wordt aan Campus Fryslân in Leeuwarden,...

  • 27 mei 2024

    Symposium 'From Tensions to Opportunities'

    Op 20 juni 2024 vindt een symposium plaats rondom de vraag 'Hoe kunnen we effectief en zinvol werken met internationalisering en diversiteit in opleidingen en studierichtingen?'. Het symposium bouwt voort op het proefschrift van Franka van den...