Le BigDataHebdo reçoit Florian Caringi, responsable des plateformes Data & IA au sein du groupe BPCE. On discute de l’évolution des architectures Big Data, de Hadoop aux environnements hybrides et cloud, avec une adoption massive de Google Cloud (BigQuery, Vertex AI) pour des usages analytiques et data science.
Florian partage son expérience sur les défis de migration, de FinOps, et l’intégration des IA génératives. Une discussion passionnante sur la modernisation des infrastructures et l’impact des nouvelles technologies dans les grandes organisations.
Chapitres
02:26 - Le parcours de Florian et l’évolution des plateformes Data chez BPCE
- Son rôle et son équipe chez BPCE
- Fusion des infrastructures et des métiers dans le groupe bancaire
06:57 - L’ère Hadoop : mise en place des premiers Data Lakes
- Contexte des années 2010-2015 : l’adoption d’Hadoop et des plateformes Big Data
- Gestion des risques et reporting bancaire sur des volumes massifs de données
- Développement des premiers use cases analytiques et opérationnels
33:01 - Début de l’hybridation : arrivée du cloud et des nouvelles plateformes
- L’impact de Power BI et des solutions SaaS dans la transformation
- Adoption progressive du cloud (GCP, BigQuery, Databricks, Snowflake étudié)
- Différences de modèle économique entre on-prem et cloud
52:35 - Les nouvelles pratiques et méthodologies en environnement hybride
- Création d’équipes Data Engineering & FinOps
- Intégration des conteneurs et services cloud
- Évolution des rôles : Data Engineers, ML Engineers, Analytics Engineers
58:26 - L’essor des LLM et de l’IA Générative dans BPCE
- Intégration de GPT et Gemini en interne
- Déploiement des bases vectorielles et RAG
- Exploration des modèles LLM open source et hybrides
- Sécurisation et gouvernance avec Giskard
72:52 - Perspectives sur l’avenir des plateformes data
- Réflexions sur la portabilité des workloads
- Le rôle de l’open source et du SaaS dans les stratégies cloud
Pour suivre Florian
Animateurs
- Vincent : Linkedin, Carnet Data et IA et DataTask
- Jérôme : @jxerome et Zeenea
- Paul : @paulpeton et methodidacte
Sponsors
Cette publication est sponsorisée par DataTask et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.
Datatask vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! DataTask
Consultez blog de DataTask pour en savoir plus.
Le générique a été composé et réalisé par Maxence Lecointe