DataGen

Robin Conquet
undefined
9 snips
Oct 13, 2023 • 35min

#87 - Dinmo : Le Reverse ETL des équipes Métier

Oussama Ghanmi a été Chief Data Officer chez Ornikar (scaleup valorisée plus de 600 millions d’euros) et Directeur au sein du cabinet de conseil en data M13h. Aujourd’hui, il a lancé un nouvel outil de Reverse ETL à destination des équipes Métier : Dinmo. L’objectif est d’autonomiser les équipes Métier dans l’activation des données et aussi de permettre aux équipes Data de se concentrer sur les projets à forte valeur ajoutée.On aborde :🔥 Son parcours, d’Ornikar à Dinmo, en passant par le conseil,🔥 Ce qu’est un reverse-ETL et comment Dinmo se positionne sur ce marché,🔥 Les principales difficultés qu’Oussama a rencontrées : l'aventure entrepreneuriale en tant que solo-founder, trouver les premiers clients pour co-designer la solution,🔥 L’enjeu de souveraineté technologique lié au développement de pépites data Française.---🎬 CHAPITRES00:00 Générique00:57 Introduction01:30 Le parcours d'Oussama de CDO à entrepreneur en passant par le conseil05:29 Oussama définit les concepts d’ETL et de Reverse ETL07:17 La genèse de Dinmo10:52 L'avantage comparatif de Dinmo sur le marché18:00 Pourquoi le serf-service est indispensable pour scaler ?20:19 Les difficultés rencontrées dans le développement du produit28:46 Les next steps de Dinmo31:42 Les ressources recommandées par Oussama32:25 Ce qu'il aime dans la data33:07 Ce qui l’a le plus fait progresser34:06 Tester Dinmo---❤️ PARTENAIRECe podcast est rendu possible par Dinmo, l’outil de Reverse ETL développé par Oussama.👉 Demandez une démo du produit ici.---📚 RESSOURCES- Modern Data Network (MDN)- Locally Optimistic---🧐 AUTRES ÉPISODES#76 - FLOA : Créer une organisation data autonome#75 - Fabric : L'alternative de Microsoft à la Modern Data Stack ?#45 - Voyage Privé : Migrer vers la Modern Data Stack---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
4 snips
Oct 10, 2023 • 37min

#86 - Vestiaire Collective : Développer un algorithme d’automatisation pour scaler

🎁 LIEN VERS LE FORMULAIRE A REMPLIR (2 MIN) POUR TENTER DE GAGNER DES AIRPODS 3E : https://bit.ly/48AppYP 🎁---Adrien Marteau est Head of Data Science chez Vestiaire Collective, la licorne qui permet à ses utilisateurs de vendre et d’acheter des articles mode de seconde main. En grandissant, les équipes responsables d’authentifier les articles sont vite devenues débordées. Ils ont donc développé un algorithme pour automatiser les mises en ligne les plus simples, permettant aujourd’hui d’ajouter 1 demi-million d’articles chaque mois !On aborde :🔥 Le parcours d'Adrien et ses débuts en tant que 1er Data Scientist chez Vestiaire Collective,🔥 Son plus gros challenge : développer un algorithme pour automatiser la mise en ligne des articles,🔥 Les principales difficultés qu’il a rencontrées : la sélection des données utilisées, l’identification du bon niveau d’automatisation et le monitoring de la performance de l’algorithme.🔥 Le fonctionnement de l’algorithme et l’organisation de l’équipe Data.---🎬 CHAPITRES00:00 Générique02:03 Introduction01:52 L’organisation de l’équipe Data chez Vestiaire Collective06:44 Le parcours d'Adrien et ses débuts en tant que premier Data Scientist09:40 Leurs enjeux d'automatisation13:43 Du Proof of Concept au modèle actuel21:26 Le process itératif mis en place avec l'équipe Métier25:43 Le fonctionnement de l'algorithme26:18 L'équipe technique derrière l'algorithme28:07 Les plus grosses difficultés d'Adrien (accessibilité des données, niveau d’automatisation, drifting)31:19 Les ressources recommandées par Adrien33:17 Ce qu'il aime dans la data34:34 Ce qui l’a le plus fait progresser35:25 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Rivery.Demandez une démo du produit ici.---📚 RESSOURCES- The Visual Display of Quantitative Information- The Design Of Everyday Things- Mindset: The New Psychology of Success- La newsletter de Jean-Charles Samuelian- La newsletter Neuron---🧐 AUTRES ÉPISODES#30 - Data For Good | BechdelAI : Détecter les films sexistes via l’IA#16 - Veepee : Développer un moteur de recommandation pour personnaliser son site---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
20 snips
Oct 5, 2023 • 27min

#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau

ECOUTER LE 2EME EPISODE SUR LA MODERN DATA STACK (#203) AVEC MATTHIEU---Matthieu Rousseau est un expert en Data Engineering et a lancé Modeo, un cabinet de conseil spécialisé sur la mise en place de Modern Data Stack.On aborde :🔥 La différence entre une stack traditionnelle et une Modern Data Stack,🔥 Les étapes pour la mettre en place : Audit, Data Warehouse, Ingestion, Orchestration, Transformation, etc.🔥 Les difficultés lorsqu’on met en place une stack data : la mesure de l’impact et de l’usage,🔥 Les conseils de Matthieu pour mettre en place adopter une Modern Data Stack.---🎬 CHAPITRES00:00 Générique 01:42 Introduction02:52 Le parcours de Matthieu05:11 La différence entre une stack traditionnelle et une “Modern Data Stack”06:53 Les étapes pour mettre en place une Modern Data Stack21:11 Les difficultés que l'on rencontre en mettant en place une Modern Data Stack22:09 Les conseils de Matthieu pour mettre en place sa Modern Data Stack23:26 Les ressources recommandées par Matthieu24:04 Ce qu'il aime dans la data24:40 Ce qui l’a le plus fait progresser25:12 Le meilleur conseil qu'on lui a donné25:46 Contacter Matthieu---❤️ PARTENAIRESCe podcast est rendu possible par Rivery, l'ETL qui bouscule le marché.👉 Demandez une démo du produit ici.Ce podcast est rendu possible par Modeo.👉 Contactez Matthieu sur son adresse matthieu@modeo.ai ou sur LinkedIn.---📚 RESSOURCES- Le Slack Modern Data Network- Les Meetups Modern Data Stack- La newsletter de DBT The Analytics Engineering Roundup---🧐 AUTRES ÉPISODES#82 - Rivery : l’ETL moderne qui bouscule le marché#45 - Voyage Privé : Migrer vers la Modern Data Stack#20 - Gorgias : Migrer vers la Modern Data Stack---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
16 snips
Sep 29, 2023 • 39min

#84 - Veepee : Utiliser les Data Contracts pour scaler sa Data Platform

🎁 LIEN VERS LE FORMULAIRE A REMPLIR (2 MIN) POUR TENTER DE GAGNER DES AIRPODS 3E : https://bit.ly/48AppYP 🎁---Victor Cumer est Head of data platforms chez Veepee (ex-Vente-privée.com), la licorne française leader européenne des ventes événementielles en ligne. Ils sont 50 profils data et comptent 3 millions visiteurs uniques chaque jour dans 10 pays.On aborde :🔥 Son parcours et ses débuts au sein du Graduate Program spécialisé data,🔥 La stack data de Veepee (DBT, Airflow, GCP, Informatica…),🔥 Le lancement d’un outil d’ingestion de données in-house qui repose sur une approche Data Contracts,🔥 Les principales difficultés rencontrées tout au long du projet : vision du produit, adoption…---🎬 CHAPITRES00:00 Introduction02:29 Son parcours et ses débuts au sein du Graduate Program spécialisé data08:44 La stack data de Veepee (DBT, Airflow, GCP…)14:17 L'outil d'ingestion in-house de Veepee et les data contracts26:33 Pourquoi mettre en place cet outil d'ingestion unique et des data contrats ?29:35 Les premiers POC30:50 Le plus gros challenge de Victor sur le projet : l’adoption34:19 Les ressources recommandées par Victor36:15 Ce qu'il aime dans la data37:03 Ce qui l’a le plus fait progresser37:30 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Rivery.Demandez une démo du produit ici.---📚 RESSOURCES- La newsletter Blef.fr de Christophe Blefari- Modern Data Stack : le site, la newsletter, le podcast---🧐 AUTRES ÉPISODES#67 - Les 4 tendances data de 2023 avec Christophe Blefari (Aka Blef.fr)#16 - Veepee : Développer un moteur de recommandation pour personnaliser son site#45 - Voyage Privé : Migrer vers la Modern Data Stack---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
Sep 24, 2023 • 33min

#83 - Le Wagon : Former des profils data & IA en quelques semaines

Paul Mochkovitch est VP Data & Content chez Le Wagon, l’école de code qui s’est fait connaître pour ses formations intensives en développement. Ils se sont élargis aux métiers de la Data et de l’IA avec le lancement initialement d’un bootcamp de Data Science puis de Data Analyse. Aujourd’hui, ils lancent un bootcamp sur le Data Engineering.On aborde :🔥 Son parcours, du lancement du bootcamp Emil à son rachat par Le Wagon,🔥 Les différents bootcamps du Wagon et les profils concernés,🔥 Le lancement du nouveau bootcamp Data Engineering.🔥 L’avis de Paul sur l’évolution du métier de Data Scientist avec ChatGPT et les autres LLM.---🎬 CHAPITRES00:00 Introduction02:34 Le parcours de Paul  06:37 Les derniers chantiers du Wagon09:49 Lancement du bootcamp Data Engineering11:38 A qui s'adresse ce nouveau bootcamp Data Engineering ?15:58 Une journée type du Bootcamp Data Engineering19:22 Quel avenir pour les Data Scientists avec ChatGPT ?25:58 Les ressources recommandées par Paul28:12 Ce qu'il aime dans la data29:12 Ce qui l’a le plus fait progresser31:13 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Le Wagon. Découvrez toutes leurs formations ici.---📚 RESSOURCES- Natural Language Processing With Transformers: Building Language Applications With Hugging Face de Thomas Wolf, Lewis Tunstall et Leandro von Werra- Designing Data–Intensive Applications de Martin Kleppmann---🧐 AUTRES ÉPISODES#80 - ChatGPT et la tendance des LLM avec Marc Sanselme#67 - Les 4 tendances data de 2023 avec Christophe Blefari (Aka Blef.fr)#20 - Gorgias : Migrer vers la Modern Data Stack---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
Sep 20, 2023 • 33min

#82 - Rivery : l’ETL moderne qui bouscule le marché

🎁 LIEN VERS LE FORMULAIRE A REMPLIR (2 MIN) POUR TENTER DE GAGNER DES AIRPODS 3E : https://bit.ly/48AppYP 🎁---Ariel Pohoryles est Head of Product Marketing chez Rivery, la scale-up qui bouscule le marché de l'ETL (Extract Transform Load) en France et à l'international. Après un démarrage en Israël et une croissance rapide aux US, ils arrivent en force sur le marché français où ils ont déjà convaincu BlaBlaCar ou Welcome to the Jungle qui avaient évoqué l’outil lors de leur passage sur DataGen. 🎙J’ai voulu en savoir plus sur ce nouvel outil en invitant Ariel. 🧐On aborde :🔥 Le parcours d’Ariel entre le Canada, la France et l’Israël,🔥 Le marché des ELT et l’usage de ces outils,🔥 La genèse de Rivery,🔥 Son positionnement (ingestion, transformation et reverse-ETL).---🎬 CHAPITRES00:00 Introduction02:25 Le parcours d'Ariel05:44 La genèse de Rivery07:18 Un ETL, c’est quoi ?12:14 Le positionnement de Rivery sur le marché des ETL21:45 Les avantages de l'outil26:04 Les ressources recommandées par Ariel27:08 Ce qu'il aime dans la data28:19 Ce qui l’a le plus fait progresser28:57 Le meilleur conseil qu'on lui a donné---❤️ PARTENAIRECe podcast est rendu possible par Rivery.Demandez une démo du produit ici.---📚 RESSOURCES- Le Substack de Ben Stancil- Les articles de Lauren Balik sur Medium- Viz of the Day de Tableau Public---🧐 AUTRES ÉPISODES#75 - Fabric : L'alternative de Microsoft à la Modern Data Stack ?#67 - Les 4 tendances data de 2023 avec Christophe Blefari (Aka Blef.fr)#45 - Voyage Privé : Migrer vers la Modern Data Stack---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
Sep 19, 2023 • 27min

#81 - JCDecaux : Lancer une nouvelle offre data pour 80 pays

🚀 LE POST LINKEDIN A COMMENTER POUR GAGNER UN FULL PASS GRATUIT POUR LE BIG DATA & IA PARIS LES 25 et 26 SEPTEMBRE 2023 : le lien sera ajouté le 19/09 à 10h.---Isaline Duminil est Global Client Partner chez JCDecaux, le n°1 mondial de la publicité outdoor qui touche quotidiennement 850 millions de personnes dans 80 pays. Depuis quelques années, ils ont lancé une nouvelle offre data pour accompagner encore mieux les marques dans l'optimisation de leurs campagnes outdoor.On aborde :🔥 La genèse de l’offre data,🔥 Les piliers de cette offre data (Optimize, Engage, Evaluate),🔥 L’organisation en interne et les différentes phases,🔥 La principale difficulté d’Isaline : le change management.---🎬 CHAPITRES00:00 Introduction04:06 Le parcours d’Isaline05:46 L’offre data “JCDecaux Data Solution”09:13 La genèse de l’offre12:54 Les étapes du lancement de l’offre17:02 Les 3 piliers de l’offre (Optimize, Engage, Evaluate)17:58 Le déploiement de l’offre21:36 La principale difficulté : le change management23:09 La prochaine étape du déploiement : la déclinaison de l’offre pour les villes24:29 Les ressources recommandées par Isaline24:52 Ce qu'elle aime dans la data25:28 Ce qui l’a le plus fait progresser25:47 Le meilleur conseil qu'on lui a donné---🧐 AUTRES ÉPISODES#79 - SUEZ : Lancer le département Data d’un grand groupe#78 - Air France : Assurer l’adoption des produits data#54 - Pernod Ricard : Lancer des programmes de Data Science---📚 RESSOURCELe podcast Ping! avec Gregory Pouy---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
18 snips
Sep 14, 2023 • 40min

#80 - ChatGPT et la tendance des LLM avec Marc Sanselme

Marc Sanselme est un expert en data science, machine learning, et intelligence artificielle. Après avoir travaillé chez Tesla, il a lancé son agence dédiée à la R&D en intelligence artificielle. En parallèle, il anime le podcast Data-Driven 101 sur la Data et l’IA.On aborde :🔥 Les cas d’usages principaux en entreprise,🔥 Les métiers impactés par ces IA,🔥 Le dilemme entre développer son IA en interne ou utiliser un outil disponible sur le marché,🔥 L’enjeu de la confidentialité derrière l’utilisation des outils externes.---🎬 CHAPITRES00:00 Introduction02:15 Le parcours de Marc03:38 Chat GPT et la tendance des LLM (Large Language Models)09:13 Quelques illustrations concrètes des LLM en entreprise16:10 Créer un ChatGPT interne dans son entreprise19:45 L'enjeu de la confidentialité des données derrière l'utilisation des outils d'IA externes22:23 Les limites des IA génératives28:45 Quels profils travaillent sur ces projets en interne ?33:39 Les entreprises doivent-elles suivre cette tendance ou attendre ?36:17 Les ressources recommandées par Marc36:13 Ce qu'il aime dans la data37:30 Ce qui l’a le plus fait progresser37:11 Le meilleur conseil qu'on lui a donné---📚 RESSOURCES- Ecouter le podcast Data Driven 101- Suivre Yann LeCun (lien LinkedIn)---🧐 AUTRES ÉPISODES#67 - Les 4 tendances data de 2023 avec Christophe Blefari (Aka Blef.fr)#54 - Pernod Ricard : Lancer des programmes de Data Science#24 - Gojob : Développer un algorithme de matching---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
14 snips
Sep 12, 2023 • 27min

#79 - SUEZ : Lancer le département Data d’un grand groupe

Claire, Head of Data et AI chez Suez, un des leaders mondiaux de la gestion de l'eau et des déchets, nous raconte les chantiers data principaux qui ont marqué l’entreprise ces 4 dernières années. On aborde :🔥 Le lancement du Data Office chez Suez,🔥 Les grands chantiers de ces dernières années : Architecture, Gouvernance, Culture et IA,🔥 Son principal challenge : l’acculturation des équipes et du Comex,🔥 Un use case passionnant entre enjeux data et environnementaux : comment ils ont optimisé la qualité et le coût du traitement des déchets de leurs usines.---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---🎬 CHAPITRES00:00 Générique01:37 Intro04:42 L'organisation du Data Office chez Suez05:48 1er chantier : l'architecture07:26 2ème chantier : la gouvernance10:36 3ème chantier : la culture14:03 4ème chantier : l'IA15:07 L’approche au moment du lancement du Data Office17:20 Le principal challenge : l'acculturation des équipes métiers et du Comex19:32 La data dans les usines de traitement des déchets23:31 Les next steps de l’équipe Data 24:08 Les questions de la fin (ses ressources, son conseil..)---🧐 AUTRES ÉPISODES#78 - Air France : Assurer l’adoption des produits data#60 - Décathlon : Implémenter une nouvelle stratégie Analytics#54 - Pernod Ricard : Lancer des programmes de Data Science---📚 RESSOURCESLe livre L'intelligence artificielle n'existe pas de Luc JuliaLe dernier livre On va droit dans le mur ? Pour sauver la planète, il faut un projet de société et une ambition de civilisation de Luc Julia---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
undefined
Sep 6, 2023 • 36min

#78 - Air France : Assurer l’adoption des produits data

Julie Pozzi est Head of Operations Research, Data Science & Data Strategy chez Air France KLM. La compagnie aérienne fait de la data depuis 25 ans et compte aujourd’hui 300 profils data au sein du Groupe.On aborde :🔥 L’histoire de la data chez AirFrance,🔥 Ses principaux chantiers : data quality, gouvernance, transversalité, etc.🔥 Son plus gros challenge : l’acculturation des équipes et du Comex,🔥 Comment elle tente de garantir l’adoption des outils Data.---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---🧐 AUTRES ÉPISODES#64 - Brut : Premiers Chantiers Data, Business Intelligence & Éthique#60 - Décathlon : Implémenter une nouvelle stratégie Analytics#54 - Pernod Ricard : Lancer des programmes de Data Science---📚 RESSOURCESuivre Cassie Kozyrkov---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹 Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

The AI-powered Podcast Player

Save insights by tapping your headphones, chat with episodes, discover the best highlights - and more!
App store bannerPlay store banner
Get the app