技术落地角度看RAG及其花式变体原理/选型建议-精品课程-软件研发管理培训、咨询服务-MSUP

课程简介

本课程为您系统梳理RAG技术从原理到落地的全貌。我们将深入解析传统RAG、GraphRAG、多模态RAG等花式变体的核心原理、适用场景与选型依据，助您知其然更知其所以然。

课程将详解知识库处理、召回、Prompt优化等关键技术，并聚焦代码/SQL生成等真实案例，深度剖析RAG在落地中的典型坑点与应对策略。您将学习到从查询重写、多路召回到效果评估的一整套优化方法论，并获得主流框架与模型的选型指南。

无论您是希望掌握RAG系统设计与优化的工程师，还是寻求技术前沿视野的决策者，本课程都将助您构建完整的RAG知识体系，从容应对企业级应用挑战。

目标收益

1、了解目前RAG都有哪些变体？如传统RAG、GraphRAG、DeepResearch、多模态RAG等各个变体的特点和适用场景，了解技术原理，知所以然；
2、了解面向RAG的知识库的处理方案、可用工具及相关模型；
3、了解目前RAG在真实落地中的问题坑点及常见应对措施，如chunk切分、rank排序等；
4、了解当前RAG的一些实际案例，都用来做什么？哪些可以做，哪些不可以做；
5、了解当前RAG的前沿技术和发展趋势，指出后续值得关注和投入的点。
6、了解针对RAG或者大模型应用过程中特定问题做特定分析，定位并解决问题的思路。

培训对象

课程内容

DAY1-从技术理论层对RAG有个直观的理解跟正确的认知；(6h)

1、RAG的基础认知 (0.5H)
1.1 什么是RAG，为什么要做RAG，什么场景下应该用RAG？
1.2 RAG的实现流程是什么？每个步骤分别在解决什么问题？
1.3 常见的RAG应用场景有哪些？大家都在用RAG做什么？
1.4 目前RAG的整个技术发展是怎样的？有什么变化趋势？

2、RAG中的R应该怎么做？文档处理及召回技术 (2H)
2.1 什么是RAG中的R是什么？
2.2 RAG中知识库怎么设计？怎么处理？有哪些粒度？
2.3 RAG中的文档怎么解析？不同数据来源怎么分开做处理？表格、图表、段落、标题、标题层级等如何解析？有哪些开源的工具跟案例？怎么清洗数据？
2.4 RAG中的文档应该怎么切分，如何做索引？
2.5 RAG中的文档向量化应该如何做？如何选择好的embedding向量化模型？如何针对性优化自己的向量模型？
2.6 RAG中的文档检索、排序怎么做？向量化数据库怎么选？有哪些差异？重排？混合检索是什么？

3、RAG中的A和G应该怎么做？prompt优化及生成技术 (1.5H)
3.1 RAG中的A和G是什么？
3.2 RAG中的prompt应该如何设计，召回后的内容如何进行组装？
3.3 RAG中的G通常都会有哪些常见能力？问答？引文生成？问题生成？如何设计？
3.4 如何合成RAG的技能微调数据集？现有的合成工具有哪些，思路有哪些？

4、RAG有哪些变体？从GraphRAG到多模态RAG再到Deepresearch (2H)
4.1 什么是GraphRAG，为什么要做Graphrag？Graphrag的核心点是什么？都怎么做的？坑是什么？适合做什么？不适合做什么？有哪些框架？
4.2 什么是多模态RAG，为什么要做多模态RAG？一般怎么做？不同模态的信息如何组织？如何解析？如何做生成？有哪些框架？
4.3 什么是Deepresearch，为啥要做AgenticRAG? 其技术核心点是什么？

DAY2-从实际案例增进在实际中RAG应该如何去设计跟优化（共6h）

5、RAG的基础设施问题-在实际企业落地时主流的RAG框架（0.5h）
5.1 当前有哪些成熟的RAG框架，其特性是什么？Ragflow，dify，qanything，maxkb?
5.2 当前搭建RAG有哪些比较好的现成模型？embedding? 文本大模型，多模态大模型？文档解析模型？
5.3 我们在进行研发时，一般去哪儿，如何选择合适的模型？

6、RAG的典型案例及优化实践思路（3h）
6.1 RAG用于代码生成怎么做？可行性论证及存在的落地风险
6.2 RAG用于SQL生成怎么做？ChatBI问数类产品的实现逻辑及落地困难
6.3 当前RAG在实际落地过程中有哪些典型问题？
6.4 从业务端优化RAG效果有哪些思路跟常见做法？
6.5 从技术角度优化RAG都有哪些思路？query改写，query意图分类，query分解，多路召回，hyde等方式？
6.6 从评估角度如何评估现有RAG方案的效果，如何分析和定位RAG出现的问题？

7、在实际落地中RAG的工程侧建议及现场交流（2.5h）
7.1 RAG在实际落地过程中会有哪些工程性问题？速度？安全问题？
7.2 RAG在工程上有哪些坑点和建议？
7.3 现场交流，共同讨论优化问题。
7.4 课程总结：Agent做应用是不是泡沫？应不应该躲着走？是未来还是大坑？

技术落地角度看RAG及其花式变体原理/选型建议

lius

老刘说NLP公众号作者

课程费用

5800.00 /人

课程时长

2天