IA Sob Controle - Inteligência Artificial cover image

238: Por que a Hugging Face não quer ser um frontier lab, com Leandro von Werra

IA Sob Controle - Inteligência Artificial

00:00

Papel do RL e técnicas de pós-treinamento

Leandro detalha TRL, importância do SFT, DPO e quando RL (GPRO) adiciona ganhos finais.

Play episode from 35:29
Transcript

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app