programmier.bar – der Podcast für App- und Webentwicklung cover image

Deep Dive 203 – AI in Production mit Maximilian Hudlberger

programmier.bar – der Podcast für App- und Webentwicklung

00:00

Latenz: Architektur und Realtime-Modelle

Maßnahmen gegen Latenz: kleinere Modelle, weniger Output, Realtime-Speech-Modelle und Caching-Effekte.

Play episode from 49:56
Transcript

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app