Dans cet épisode, on revient en profondeur sur le concept de RAG (Retrieval-Augmented Generation), une approche devenue incontournable dans l’usage des LLMs en entreprise.
Après avoir rappelé les limites des moteurs de recherche traditionnels, on décrypte le fonctionnement du RAG, ses composants clés (retrieval, vectorisation, chunking, hybrid search, re-ranking), et les défis rencontrés (hallucinations, granularité des documents, performance).
Ils discutent aussi des bonnes pratiques d’implémentation, des enjeux d’évaluation de la qualité, des optimisations possibles (caching, HIDE, hybrid search), ainsi que de l’avenir du RAG dans des architectures plus évoluées comme les agents IA ou les approches modulaires. Le tout avec des retours concrets tirés de projets menés sur le terrain.
Au programme :
- Ce qu’est (et n’est pas) le RAG
- Les bonnes pratiques : chunking, vectorisation, hybrid search, re-ranking
- Les pièges courants : hallucinations, mauvaise structuration, perte de contexte
- Les évolutions en cours : agentic RAG, caching, frameworks modulaires
- Et quelques retours d’expérience concrets tirés de projets clients
Animateurs
- Vincent : Linkedin, Carnet Data et IA et DataTask
- Jérôme : @jxerome et Zeenea
- Paul : @paulpeton et methodidacte
- Nicolas: @nsteinmetz, CerenIT, [Time Series France](https://www.timeseries.fr/
Sponsors
Cette publication est sponsorisée par Affini-Tech et CerenIT.
CerenIT vous accompagne pour concevoir, industrialiser ou automatiser vos plateformes mais aussi pour faire parler vos données temporelles. Ecrivez nous à contact@cerenit.fr et retrouvez-nous aussi au Time Series France.
Affini-Tech vous accompagne dans tous vos projets Cloud et Data, pour Imaginer, Expérimenter et Executer vos services ! (Affini-Tech, Datatask)
Consulter le blog d’Affini-Tech et le blog de Datatask pour en savoir plus.
On recrute ! Venez cruncher de la data avec nous ! Ecrivez nous à recrutement@affini-tech.com
Le générique a été composé et réalisé par Maxence Lecointe