Kunnen we straks in het West-Vlaams praten tegen onze smartphone of auto? Wel als het van ‘Maarallee’ afhangt: een project dat artificiële intelligentie via duizenden spraakopnames wil leren omgaan met dialecten. Daarvoor hebben ze onze hulp nodig, in het bijzonder van West-Vlaamse vrouwen.
Hoe klinkt Vlaanderen echt? Dat willen het Vlaamse Kenniscentrum Scivil en KU Leuven te weten komen via Maarallee, een app waarmee ze stemmen uit alle hoeken van Vlaanderen verzamelen. Via de verzamelde fragmenten willen de ontwikkelaars alle Vlaamse dialecten verstaanbaar maken voor artificiële intelligentie (AI). “Momenteel zijn er maar weinig opnames van Vlaamse spraak vrij beschikbaar voor kleinere ontwikkelaars”, zegt Isaak Vandermaesen, projectmedewerker AI en Educatie bij Scivil. “Met Maarallee willen we daar verandering in brengen door een dataset op te bouwen van alle regionale taalvarianten in Vlaanderen.”
Via de website maarallee.be of de app kan iedereen zelf eenvoudig een spraakopname toevoegen aan de dataset. Op de app staan verschillende vragen waarop je via een opname kunt antwoorden. “Veel mensen weten niet goed wat ze kunnen vertellen, en de vragen helpen hen op weg. Hoe uitgebreider het antwoord, hoe beter”, legt Isaak Vandermaesen uit. De vragen worden regelmatig vervangen om een zo breed mogelijke verzameling woorden te creëren. “Bij een vraag zoals wat je vaste frituurbestelling is, krijgen we natuurlijk vaak dezelfde woorden”, lacht Isaak.
Plat dialect
Een eigen boodschap is ook altijd welkom. “Gebruikers mogen zoveel praten als ze willen, over wat ze maar willen.” Net zoals bij een voicemail begin je gewoon te spreken na het startsignaal, wat het heel gebruiksvriendelijk maakt. “Het antwoord mag van plat dialect tot vrij verzorgd Algemeen Nederlands zijn. We zijn op zoek naar zoveel mogelijk variatie.”
Het doel van Maarallee is om 2.000 uur aan spraakopnames te verzamelen. “We hebben nu al 700 opnames van gemiddeld ongeveer een minuut”, vertelt Vandermaesen. “Voor een volledig werkend AI-model hebben we eigenlijk 6.000 uur nodig. Omdat het nog een klein experimenteel project is, zouden we echter al blij zijn als we een derde daarvan halen.” Het project loopt voorlopig tot juni 2026.
“We doen in het bijzonder een oproep aan jongeren en ouderen, vrouwen, en West-Vlamingen die verhuisden naar een andere provincie”
Isaak Vandermaesen
Projectmedewerker AI en Educatie
De Maarallee-app wil zoveel mogelijk variatie in dialecten verzamelen. “In principe heeft AI niet echt moeite met het begrijpen van dialecten, zolang er maar genoeg data beschikbaar is. Voorlopig is Limburgs het lastigst, omdat daarvan nog het minste materiaal bestaat”, klinkt het. “In bestaande datasets, zoals audio van de VRT of tv-series, vinden we al behoorlijk wat West-Vlaams terug. Wat ontbreekt, zijn vooral vrouwelijke stemmen, omdat er vroeger minder vrouwen op radio en tv te horen waren.”
Iedereen verstaan
Daarnaast zijn opnames van jongeren en oudere mensen erg welkom. “Jonge mensen hanteren vaak jongerentaalwoorden, terwijl ouderen vaak nog meer dialectwoorden gebruiken. Deze variatie heeft onze dataset zeker nodig. Het is belangrijk dat AI alle soorten stemmen begrijpt, ongeacht gender, leeftijd of dialect. Zo kan technologie, zoals bijvoorbeeld een gps, alle Vlamingen correct verstaan. Maarallee wil daarom inzetten op diversiteit, zowel in mensen als in dialecten. Ook moedigen we mensen aan om in hun eigen omgeving spraakopnames te verzamelen bij vrienden en familie, zodat de dataset zo divers mogelijk wordt.”
Maarallee legt de nadruk op het ethische aspect van hun dataverzameling. “De opnames worden volledig vrijwillig ingestuurd, en deelnemers weten waarom ze hun opnames insturen. Het team luistert bovendien zo min mogelijk naar de opnames om de privacy van de deelnemers te beschermen. Alleen een kleine groep medewerkers die de data moet verwerken, krijgt toegang”, benadrukt Isaak Vandermaesen.
The post Bijzonder project wil AI leren om ons dialect te verstaan… en heeft daarvoor onze hulp nodig: “Vooral stemmen van West-Vlaamse vrouwen tekort” is provided by KW.be.
