课程简介
让学员了解RAG的实现范式,了解其中的技术原理,并通过实践案例能够自己动手搭建一个RAG。
目标收益
培训对象
课程内容
1、RAG中的文档处理范式
1.1 RAG中的文档处理关键技术
1.1.1 RAG中文档处理范式概览
1.1.2 文档版式分析技术
1.1.3 文档表格解析技术
1.1.4 文档公式识别技术
1.1.5 文档图表解析技术
1.1.6 文档阅读顺序技术
1.1.7 文档转markdown解析技术
1.2 RAG文档处理的开源工具
1.3 RAG文档处理实践
1.3.1 基于doclayout进行版式识别;
1.3.2 基于rapdidtble进行表格提取;
1.3.3 基于PDF-parser-Tookit进行pdf转markdown;
1.1.4 基于多模态模型进行OCR识别和图表理解
2、RAG中的文档切分范式
2.1 RAG中的文档切分范式
2.1.1 基于特定token size的chunk切分方案;
2.1.2 基于语义的chunk切分方案;
2.1.3 基于特定文档语法的切分方案;
2.1.3 基于long llm长文本模型的切分方案;
2.2 现有的一些RAG中的文档切分组件
2.3 RAG中的文档切分实践
3、RAG中的召回范式
3.1 RAG中的召回关键技术
3.1.1 RAG中的常用召回范式
3.1.2 RAG中的ES召回
3.1.3 RAG中的向量化召回、代表向量化模型(粗排+精排)
3.1.4 RAG中的Hybrid混合排序
3.1.5 RAG中的HyDE假设性答案文档优化策略
3.2 RAG中的检索排序现有向量化模型
3.3 RAG中的检索排序实践
4、RAG中的大模型生成
4.1 RAG中大模型生成prompt设计策略
4.2 RAG中大模型生成特定技能的微调
5、RAG整体实践案例
5.1 环境准备
5.2 数据准备
5.3 整体技术流程
5.4 整体实现搭建
6、GraphRAG的实现范式
6.1 GraphRAG主流实现范式
6.1.1 GraphRAG的使用场景和代表方案;
6.1.2 微软GraphRAG实现方案;
6.1.3 朴素GraphRAG实现方案;
6.1.4 linkedIn GraphRAG实现方案;
6.2 GraphRAG动手实践
近期公开课推荐