
Underscore_ Génération IA d’images: 4 ans de recherche résumés en 20 minutes — chronique Michaël de Marliave
13 snips
Nov 13, 2025 Dans ce podcast, Michaël explore la conception d'un outil d'IA révolutionnaire pour la gestion des podcasts. Il discute des principes de diffusion et des auto-encodeurs, ainsi que de l'équilibre entre créativité et mémorisation. L'importance de la combinaison de CLIP avec les données massives est mise en avant, tout en abordant l'édition non destructive et l'utilisation de templates de prompt pour la génération de miniatures. Les cas d'usage et les défis techniques enrichissent ce retour d'expérience fascinant sur l'innovation en IA.
AI Snips
Chapters
Transcript
Episode notes
Texte-Image Dans Un Même Espace
- L'association d'un modèle de diffusion avec CLIP permet de représenter texte et image dans le même espace vectoriel et de générer des images pour n'importe quel texte.
- Cette combinaison a déclenché la révolution actuelle des images générées par IA.
Filtrer Les Données Web
- Les datasets massifs proviennent d'Internet (Common Crawl) et nécessitent un filtrage esthétique pour retenir les images utiles.
- Des modèles de scoring esthétique entraînés sur des annotations humaines permettent de sélectionner des images de haute qualité.
Gain Grâce Aux Espaces Latents
- Le passage par un espace latent (compression) réduit drastiquement les ressources nécessaires pour générer des images réalistes.
- Cela permet de faire tourner des modèles puissants sur des machines personnelles ou en production allégée.
