programmier.bar – der Podcast für App- und Webentwicklung cover image

Deep Dive 203 – AI in Production mit Maximilian Hudlberger

programmier.bar – der Podcast für App- und Webentwicklung

00:00

Deterministische versus subjektive Evals

Unterschiede zwischen messbaren Metriken und stilistischen Bewertungen via Human Annotation und LLM-Graders.

Play episode from 14:00
Transcript

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app