
DS Vandaag Bits & atomen | Wanneer spreekt AI Vlaams? (Live op de Dag van de Wetenschap)
14 snips
Nov 29, 2025 Annelies Duerinckx, wetenschapper bij Scivil, onthult het Mar-Alee project dat gesproken Vlaams-data verzamelt om AI beter te laten begrijpen. Ze legt uit waarom diverse dialectdata cruciaal is en het belang van spontane opnames. Jelle Habay, bewegingswetenschapper, deelt ervaringen over de transparantie in wetenschappelijk falen en de noodzaak om mislukte experimenten te bespreken. Samen onderzoeken ze ook de impact van grote en kleine AI-modellen op het milieu en de kwaliteit van gegevens.
AI Snips
Chapters
Transcript
Episode notes
Crowdsourcen Met Spontane Opnames
- Verzamel zoveel mogelijk gesproken Vlaams via burgers om dialectvariatie te vangen.
- Gebruik spontane opnames in plaats van voorgedrukte zinnen om natuurlijke taal te registreren.
Genereren Vraagt Minder Data Dan Herkennen
- Spraakgeneratie vereist veel minder data dan spraakherkenning omdat je met enkele stemmen accenten kunt simuleren.
- Herkennen van alle Vlaamse varianten vraagt veel grotere datasets door hogere variatie.
Streef Naar Duizenden Uren Data
- Mik op grote hoeveelheden data: het project streeft naar minstens 6000 uur gesproken Vlaams.
- Betrek jongeren (vanaf 16) specifiek om jongerentaal en slang te vangen, rekening houdend met privacyregels.
