RLHF: Reinforcement Learning from Human Feedback

Erläuterung von RLHF, Sammeln von Feedback und dessen Nutzung zur schrittweisen Verbesserung.

Play episode from 52:30

chevron_right

Transcript

chevron_right

Transcript

Episode notes

Parameter? Tokens? Kontext? Wir alle kennen diese Buzzwords aus dem AI-Bereich. Künstliche Intelligenz ist schon jetzt aus vielen Workflows und unserem Alltag kaum mehr wegzudenken. Ein Grund mehr, sich noch einmal dem Thema anzunehmen.

Zusammen mit Fabi und Jan ist dieses Mal Fabian Hadiji zu Gast im Studio. Er beschäftigt sich nicht nur als Head of Business Intelligence bei Lotum mit dem Thema, sondern hat in diesem Gebiet promoviert und ein eigenes Startup gegründet.

In dieser Folge nehmen wir uns die Zeit, um über Begriffe und Konzepte aus der Welt der Künstlichen Intelligenz zu sprechen und verständlich zu erklären. Fabian hilft uns besser zu verstehen, wie GPT so tickt und was der Antrieb der großen Sprachmodelle ist, die uns umgeben.

In dieser Folge wollen wir all die Fragen stellen, die sich der ein oder die andere vielleicht nicht mehr zu stellen traut, nachdem das Thema schon so lange präsent ist.

Picks of the Day:

Fabi: Geblitzt.de – Hand aufs Herz, alle, die ein Auto fahren, sind schon das ein oder andere Mal geblitzt worden. ;) Viele dieser Bußgeldbescheide sind jedoch scheinbar fehlerhaft. Geblitzt.de hilft euch dabei, euren Bescheid zu prüfen und unterstützt euch nach Analyse eures Falls gegebenenfalls auch juristisch.
Fabian: Lex Fridman Podcast – Insbesondere die früheren Folgen des Lex Friedman Podcasts sind immer eine Empfehlung wert. Denn gerade in dieser Phase hat sich Lex Friedman sehr tiefgreifend mit dem Thema der Künstlichen Intelligenz beschäftigt und den Themenkomplex gemeinsam mit vielen kompetenten und auch heute noch gefragten Gäst:innen beleuchtet. Fabian empfiehlt euch insbesondere diese Folgen:
Jan Gregor: LM Studio – Mit LM Studio könnt ihr euch beliebige große Sprachmodelle herunterladen (etwa via HuggingFace) und dann lokal auf eurem Computer ausführen. Dazu gibt es nicht nur ein Chat UI, um Prompts an das gewählte Modell zu schicken und Antworten zu erhalten, sondern auch eine standardisierte API um Modell-agnostische, lokale Entwicklung betreiben zu können.

Schreibt uns!
Schickt uns eure Themenwünsche und euer Feedback: podcast@programmier.bar

Folgt uns!
Bleibt auf dem Laufenden über zukünftige Folgen und virtuelle Meetups und beteiligt euch an Community-Diskussionen.

Twitter
Instagram
Facebook
Meetup
YouTube

Musik: Hanimo

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!

Get the app

Home Top podcasts Popular guests Top books