课程简介
本课程为您系统梳理RAG技术从原理到落地的全貌。我们将深入解析传统RAG、GraphRAG、多模态RAG等花式变体的核心原理、适用场景与选型依据,助您知其然更知其所以然。
课程将详解知识库处理、召回、Prompt优化等关键技术,并聚焦代码/SQL生成等真实案例,深度剖析RAG在落地中的典型坑点与应对策略。您将学习到从查询重写、多路召回到效果评估的一整套优化方法论,并获得主流框架与模型的选型指南。
无论您是希望掌握RAG系统设计与优化的工程师,还是寻求技术前沿视野的决策者,本课程都将助您构建完整的RAG知识体系,从容应对企业级应用挑战。
目标收益
1、了解目前RAG都有哪些变体?如传统RAG、GraphRAG、DeepResearch、多模态RAG等各个变体的特点和适用场景,了解技术原理,知所以然;
2、了解面向RAG的知识库的处理方案、可用工具及相关模型;
3、了解目前RAG在真实落地中的问题坑点及常见应对措施,如chunk切分、rank排序等;
4、了解当前RAG的一些实际案例,都用来做什么?哪些可以做,哪些不可以做;
5、了解当前RAG的前沿技术和发展趋势,指出后续值得关注和投入的点。
6、了解针对RAG或者大模型应用过程中特定问题做特定分析,定位并解决问题的思路。
培训对象
课程内容
DAY1-从技术理论层对RAG有个直观的理解跟正确的认知;(6h)
1、RAG的基础认知 (0.5H)
1.1 什么是RAG,为什么要做RAG,什么场景下应该用RAG?
1.2 RAG的实现流程是什么?每个步骤分别在解决什么问题?
1.3 常见的RAG应用场景有哪些?大家都在用RAG做什么?
1.4 目前RAG的整个技术发展是怎样的?有什么变化趋势?
2、RAG中的R应该怎么做?文档处理及召回技术 (2H)
2.1 什么是RAG中的R是什么?
2.2 RAG中知识库怎么设计?怎么处理?有哪些粒度?
2.3 RAG中的文档怎么解析?不同数据来源怎么分开做处理?表格、图表、段落、标题、标题层级等如何解析?有哪些开源的工具跟案例?怎么清洗数据?
2.4 RAG中的文档应该怎么切分,如何做索引?
2.5 RAG中的文档向量化应该如何做?如何选择好的embedding向量化模型?如何针对性优化自己的向量模型?
2.6 RAG中的文档检索、排序怎么做?向量化数据库怎么选?有哪些差异?重排?混合检索是什么?
3、RAG中的A和G应该怎么做?prompt优化及生成技术 (1.5H)
3.1 RAG中的A和G是什么?
3.2 RAG中的prompt应该如何设计,召回后的内容如何进行组装?
3.3 RAG中的G通常都会有哪些常见能力?问答?引文生成?问题生成?如何设计?
3.4 如何合成RAG的技能微调数据集?现有的合成工具有哪些,思路有哪些?
4、RAG有哪些变体?从GraphRAG到多模态RAG再到Deepresearch (2H)
4.1 什么是GraphRAG,为什么要做Graphrag?Graphrag的核心点是什么?都怎么做的?坑是什么?适合做什么?不适合做什么?有哪些框架?
4.2 什么是多模态RAG,为什么要做多模态RAG?一般怎么做?不同模态的信息如何组织?如何解析?如何做生成?有哪些框架?
4.3 什么是Deepresearch,为啥要做AgenticRAG? 其技术核心点是什么?
DAY2-从实际案例增进在实际中RAG应该如何去设计跟优化(共6h)
5、RAG的基础设施问题-在实际企业落地时主流的RAG框架(0.5h)
5.1 当前有哪些成熟的RAG框架,其特性是什么?Ragflow,dify,qanything,maxkb?
5.2 当前搭建RAG有哪些比较好的现成模型?embedding? 文本大模型,多模态大模型?文档解析模型?
5.3 我们在进行研发时,一般去哪儿,如何选择合适的模型?
6、RAG的典型案例及优化实践思路(3h)
6.1 RAG用于代码生成怎么做?可行性论证及存在的落地风险
6.2 RAG用于SQL生成怎么做?ChatBI问数类产品的实现逻辑及落地困难
6.3 当前RAG在实际落地过程中有哪些典型问题?
6.4 从业务端优化RAG效果有哪些思路跟常见做法?
6.5 从技术角度优化RAG都有哪些思路?query改写,query意图分类,query分解,多路召回,hyde等方式?
6.6 从评估角度如何评估现有RAG方案的效果,如何分析和定位RAG出现的问题?
7、在实际落地中RAG的工程侧建议及现场交流(2.5h)
7.1 RAG在实际落地过程中会有哪些工程性问题?速度?安全问题?
7.2 RAG在工程上有哪些坑点和建议?
7.3 现场交流,共同讨论优化问题。
7.4 课程总结:Agent做应用是不是泡沫?应不应该躲着走?是未来还是大坑?
近期公开课推荐