DS Vandaag

Bits & atomen | Wanneer spreekt AI Vlaams? (Live op de Dag van de Wetenschap)

14 snips
Nov 29, 2025
Annelies Duerinckx, wetenschapper bij Scivil, onthult het Mar-Alee project dat gesproken Vlaams-data verzamelt om AI beter te laten begrijpen. Ze legt uit waarom diverse dialectdata cruciaal is en het belang van spontane opnames. Jelle Habay, bewegingswetenschapper, deelt ervaringen over de transparantie in wetenschappelijk falen en de noodzaak om mislukte experimenten te bespreken. Samen onderzoeken ze ook de impact van grote en kleine AI-modellen op het milieu en de kwaliteit van gegevens.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
ADVICE

Crowdsourcen Met Spontane Opnames

  • Verzamel zoveel mogelijk gesproken Vlaams via burgers om dialectvariatie te vangen.
  • Gebruik spontane opnames in plaats van voorgedrukte zinnen om natuurlijke taal te registreren.
INSIGHT

Genereren Vraagt Minder Data Dan Herkennen

  • Spraakgeneratie vereist veel minder data dan spraakherkenning omdat je met enkele stemmen accenten kunt simuleren.
  • Herkennen van alle Vlaamse varianten vraagt veel grotere datasets door hogere variatie.
ADVICE

Streef Naar Duizenden Uren Data

  • Mik op grote hoeveelheden data: het project streeft naar minstens 6000 uur gesproken Vlaams.
  • Betrek jongeren (vanaf 16) specifiek om jongerentaal en slang te vangen, rekening houdend met privacyregels.
Get the Snipd Podcast app to discover more snips from this episode
Get the app