programmier.bar – der Podcast für App- und Webentwicklung

Deep Dive 139 – GPT Under the Hood mit Fabian Hadiji

Jan 12, 2024

Fabian Hadiji, promovierter ML-Forscher und Head of Business Intelligence bei Lotum, erklärt auf verständliche Weise, wie große Sprachmodelle funktionieren. Kurze, klare Sätze zu Tokens, Embeddings und Transformer-Architektur. Diskussionen über Training, Kontextlänge, Feintuning, RLHF und welche Rolle Trainingsdaten und Hardware spielen.

Ask episode

AI Snips

Chapters

Transcript

Episode notes

ADVICE

Lerne Grundkonzepte Vor Integration

Verstehe grundlegende Konzepte von LLMs, um sinnvolle Architektur- und Kostenentscheidungen zu treffen.
Jan-Gregor empfiehlt, nicht jedes Detail zu wissen, aber Kontext, Tokens und Feintuning zu begreifen, bevor man Integrationen plant.

INSIGHT

Korpuszusammensetzung Bestimmt Modellbias

Datenqualität und Zusammensetzung des Korpus prägen Modellverhalten stark.
Fabian weist darauf hin, dass große Masse oft bevorzugt wird, aber Gewichtung (z.B. Wikipedia vs. Foren) das Ergebnis beeinflusst.

INSIGHT

Embeddings Komprimieren Bedeutung In Vektoren

Embeddings komprimieren Token-IDs zu dichten Vektoren, die semantische Nähe abbilden.
Fabian erklärt, dass Embeddings Wörter in einen mehrdimensionalen Raum legen, sodass ähnliche Begriffe näher beieinander liegen.

Get the Snipd Podcast app to discover more snips from this episode

Get the app

Parameter? Tokens? Kontext? Wir alle kennen diese Buzzwords aus dem AI-Bereich. Künstliche Intelligenz ist schon jetzt aus vielen Workflows und unserem Alltag kaum mehr wegzudenken. Ein Grund mehr, sich noch einmal dem Thema anzunehmen.

Zusammen mit Fabi und Jan ist dieses Mal Fabian Hadiji zu Gast im Studio. Er beschäftigt sich nicht nur als Head of Business Intelligence bei Lotum mit dem Thema, sondern hat in diesem Gebiet promoviert und ein eigenes Startup gegründet.

In dieser Folge nehmen wir uns die Zeit, um über Begriffe und Konzepte aus der Welt der Künstlichen Intelligenz zu sprechen und verständlich zu erklären. Fabian hilft uns besser zu verstehen, wie GPT so tickt und was der Antrieb der großen Sprachmodelle ist, die uns umgeben.

In dieser Folge wollen wir all die Fragen stellen, die sich der ein oder die andere vielleicht nicht mehr zu stellen traut, nachdem das Thema schon so lange präsent ist.

Picks of the Day:

Fabi: Geblitzt.de – Hand aufs Herz, alle, die ein Auto fahren, sind schon das ein oder andere Mal geblitzt worden. ;) Viele dieser Bußgeldbescheide sind jedoch scheinbar fehlerhaft. Geblitzt.de hilft euch dabei, euren Bescheid zu prüfen und unterstützt euch nach Analyse eures Falls gegebenenfalls auch juristisch.
Fabian: Lex Fridman Podcast – Insbesondere die früheren Folgen des Lex Friedman Podcasts sind immer eine Empfehlung wert. Denn gerade in dieser Phase hat sich Lex Friedman sehr tiefgreifend mit dem Thema der Künstlichen Intelligenz beschäftigt und den Themenkomplex gemeinsam mit vielen kompetenten und auch heute noch gefragten Gäst:innen beleuchtet. Fabian empfiehlt euch insbesondere diese Folgen:
Jan Gregor: LM Studio – Mit LM Studio könnt ihr euch beliebige große Sprachmodelle herunterladen (etwa via HuggingFace) und dann lokal auf eurem Computer ausführen. Dazu gibt es nicht nur ein Chat UI, um Prompts an das gewählte Modell zu schicken und Antworten zu erhalten, sondern auch eine standardisierte API um Modell-agnostische, lokale Entwicklung betreiben zu können.

Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback: podcast@programmier.bar

Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.

Twitter
Instagram
Facebook
Meetup
YouTube

Musik: Hanimo