Underscore_

Génération IA d’images: 4 ans de recherche résumés en 20 minutes — chronique Michaël de Marliave

13 snips
Nov 13, 2025
Dans ce podcast, Michaël explore la conception d'un outil d'IA révolutionnaire pour la gestion des podcasts. Il discute des principes de diffusion et des auto-encodeurs, ainsi que de l'équilibre entre créativité et mémorisation. L'importance de la combinaison de CLIP avec les données massives est mise en avant, tout en abordant l'édition non destructive et l'utilisation de templates de prompt pour la génération de miniatures. Les cas d'usage et les défis techniques enrichissent ce retour d'expérience fascinant sur l'innovation en IA.
Ask episode
AI Snips
Chapters
Transcript
Episode notes
INSIGHT

Texte-Image Dans Un Même Espace

  • L'association d'un modèle de diffusion avec CLIP permet de représenter texte et image dans le même espace vectoriel et de générer des images pour n'importe quel texte.
  • Cette combinaison a déclenché la révolution actuelle des images générées par IA.
INSIGHT

Filtrer Les Données Web

  • Les datasets massifs proviennent d'Internet (Common Crawl) et nécessitent un filtrage esthétique pour retenir les images utiles.
  • Des modèles de scoring esthétique entraînés sur des annotations humaines permettent de sélectionner des images de haute qualité.
INSIGHT

Gain Grâce Aux Espaces Latents

  • Le passage par un espace latent (compression) réduit drastiquement les ressources nécessaires pour générer des images réalistes.
  • Cela permet de faire tourner des modèles puissants sur des machines personnelles ou en production allégée.
Get the Snipd Podcast app to discover more snips from this episode
Get the app