
Les IA vont-elles nous rendre stupides ?
Tech Café
00:00
TurboQuant : compresser la mémoire des IA
Explication de TurboQuant de Google et de sa promesse de réduire l'usage de RAM pour les caches d'attention.
Play episode from 57:00
Transcript

Explication de TurboQuant de Google et de sa promesse de réduire l'usage de RAM pour les caches d'attention.