IA Sob Controle - Inteligência Artificial

214: Apertus, o LLM suíço totalmente aberto, com Imanol Schlag

34 snips

Jan 7, 2026

Imanol Schlag, cientista de pesquisa no ETH AI Center e co-líder do projeto Apertus, discute a transparência e reprodutibilidade do modelo de linguagem 100% aberto desenvolvido na Suíça. Ele explora como o Ato Europeu de IA afeta a conformidade e a customização de produtos, além de compartilhar detalhes sobre as vastas infraestruturas de computação envolvidas no treinamento. Imanol destaca a inclusão multilingue, os desafios enfrentados e as inovações acadêmicas que moldam o futuro do Apertus.

Ask episode

AI Snips

Chapters

Transcript

Episode notes

ANECDOTE

Dois Meses e Meio Em 4 Mil GPUs

O treino do modelo de 70B levou cerca de dois meses e meio usando 4 mil GPUs.
O maior desafio não foi ML, mas rede, armazenamento e infraestrutura compartilhada do cluster.

ADVICE

Priorize Especialistas Em Rede E Armazenamento

Envolva engenheiros de infraestrutura para depurar rede e I/O em treinos distribuídos.
Monitore throughput por GPU e investigue variações causadas por outros usuários do cluster.

INSIGHT

Qualidade de Dados e Pós‑Treinamento Importam

Filtrar conteúdo repetitivo, spam e toxicidade melhora o comportamento base do modelo.
Pós-treinamento e alinhamento são tão críticos quanto o pré-treinamento para segurança e utilidade.

Get the Snipd Podcast app to discover more snips from this episode

Get the app