课程简介
本课程为期三天,聚焦大模型在工业与企业场景的深度落地。课程摒弃空泛理论,紧扣 DeepSeek R1、Qwen 等前沿模型,深度讲解 高级提示工程、数据构造清洗、参数高效微调(LoRA/QLoRA)、向量(Embedding)微调 及 RAG文档解析 等核心技术。
全程包含 6大实操环节,从模型推理加速(vLLM)到多模态应用,手把手带领学员掌握从数据处理到私有化部署的全栈工程能力,解决业务交付中的“最后最后一公里”痛点。
目标收益
通过本课程,学员将掌握大模型技术的核心概念与应用,了解AI Agent及大模型的最新发展,熟悉国内外主流大模型的产品化与应用场景。学员将深入学习提示工程技巧,提升大模型在实际场景中的应用能力。同时,学员掌握Deepseek等大模型的实用技巧,深入了解AI在关于领域中的实际应用,如自动化数据整理、智能文档生成与工作流程优化等。完成课程后,学员能够在实际工作中熟练运用AI工具,提升个人和团队的工作效率。
培训对象
课程大纲
| 第一天-上午 |
1. 课程开场与AIGC与AI Agent综述(0.5h) 大模型原理概述,介绍课程的目标和预期的学习成果。 介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍 2. 大模型提示工程应用进阶(1.5h) 高级提示词设计方法——多轮交互、角色设定、上下文控制及隐式引导技巧,适配工业领域专业语境 多场景高阶提示工程应用:技术文档编制、设备故障诊断报告生成、生产调度方案优化、跨部门信息问答与业务流程自动化 面向 DeepSeek R1 系列大模型的提示优化策略:思维链推理、逐步求解、采样温度调优及面向工业数据的模型特性适配 课程实战与互动:大模型提示词应用实战——基于大模型的设备故障诊断报告生成(1h) |
| 第一天-下午 |
1. 大模型推理加速与部署(1h) 介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等 介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等 大模型中的量化,如AWQ量化、GPTQ、GGUF等 2. 多模态生成方法与原理介绍(1h) 基于于大模型(如Transformer)的图片生成文本技术的核心原理 介绍图生文相关模型概念,如QwenVL系类、Yi-VL等 图片生成文本的落地应用,如设备巡检、故障诊断、安防与隐患识别等 课程实战:大模型部署实战——基于vLLM的多模型部署实战(1h) |
| 第二天-上午 |
1. 大语言模中的数据构造与清洗(1h) 梳理大模型训练中的数据收集方法与数据清洗逻辑 介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法 高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例 领域数据清洗方法介绍——IFD指标法、MoDS方法等 课程实战:大模型数据构造训练实战——面向业务场景的数据收集(1h) 2、大模型RAG核心技术准备 (1h) 模型向量表征方法与常用模型分享,包括BGE、M3E、Qwen-embedding等 面向大模型RAG的检索方法概述 大模型向量的数据构造与微调方法 |
| 第二天-下午 |
课程实战:面向RAG的向量微调——基于BGE的向量微调实战(1h) 1. 大语言模中的高效参数调优及分布式训练(1h) 常用参数微调方法——Prefix Tuning、P-Tuning、LoRA 微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA 介绍当前常用的模型分布式计算方法,介绍多种并行策略,介绍多种分布式框架及代码解析 课程实战:大模型微调实战——基于Qwen的大模型微调实战(1h) |
| 第三天-上午 |
1. 面向RAG的文档处理技术介绍(1h) 基于传统模型的文档数字化解析的技术原理与点滴 基于多模态文档解析:如PDF复杂表格识别、基于图片的直接问答交互等 文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述 2、大模型RAG核心技术分享 (1h) 大模型RAG整体框架梳理 向量数据库介绍——Faiss、Milvus、Pinecone、Weaviate等 大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与知识图谱等问答交互领域的应用与落地。 课程实战:大模型RAG搭建实战(1h) |
| 第三天-下午 |
1、课程互动与实践(1h) 针对工业企业与相关业务场景,分组互动,整理当前基于大模型的场景化落地方案与技术实现路径 2、大模型应用产品化及交付经验分享(1h) 介绍企业大模型场景化行业应用案例 大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。 大模型在工业领域的交付案例详述,包括智能问数、智能问答、智能编排等场景中的交付案例 3. 交流与沟通(1h) 课后交流 |
|
第一天-上午 1. 课程开场与AIGC与AI Agent综述(0.5h) 大模型原理概述,介绍课程的目标和预期的学习成果。 介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍 2. 大模型提示工程应用进阶(1.5h) 高级提示词设计方法——多轮交互、角色设定、上下文控制及隐式引导技巧,适配工业领域专业语境 多场景高阶提示工程应用:技术文档编制、设备故障诊断报告生成、生产调度方案优化、跨部门信息问答与业务流程自动化 面向 DeepSeek R1 系列大模型的提示优化策略:思维链推理、逐步求解、采样温度调优及面向工业数据的模型特性适配 课程实战与互动:大模型提示词应用实战——基于大模型的设备故障诊断报告生成(1h) |
|
第一天-下午 1. 大模型推理加速与部署(1h) 介绍常用的大模型推理框架与原理,如vLLM、SGLang、FastLLM等 介绍常用大模型整体服务框架,llama.cpp、llama-factory、ollama等 大模型中的量化,如AWQ量化、GPTQ、GGUF等 2. 多模态生成方法与原理介绍(1h) 基于于大模型(如Transformer)的图片生成文本技术的核心原理 介绍图生文相关模型概念,如QwenVL系类、Yi-VL等 图片生成文本的落地应用,如设备巡检、故障诊断、安防与隐患识别等 课程实战:大模型部署实战——基于vLLM的多模型部署实战(1h) |
|
第二天-上午 1. 大语言模中的数据构造与清洗(1h) 梳理大模型训练中的数据收集方法与数据清洗逻辑 介绍基于Self-instruct的数据构造方法、介绍面向结构化知识的数据构造方法 高质量数据收集与清洗分享——以参与的开源数据集Chinese-DeepSeek-R1-Distill-data-110k为例 领域数据清洗方法介绍——IFD指标法、MoDS方法等 课程实战:大模型数据构造训练实战——面向业务场景的数据收集(1h) 2、大模型RAG核心技术准备 (1h) 模型向量表征方法与常用模型分享,包括BGE、M3E、Qwen-embedding等 面向大模型RAG的检索方法概述 大模型向量的数据构造与微调方法 |
|
第二天-下午 课程实战:面向RAG的向量微调——基于BGE的向量微调实战(1h) 1. 大语言模中的高效参数调优及分布式训练(1h) 常用参数微调方法——Prefix Tuning、P-Tuning、LoRA 微调方法进阶——DyLoRA、AdaLoRA、QLoRA、QALoRA、LongLoRA、VERA、S-LoRA 介绍当前常用的模型分布式计算方法,介绍多种并行策略,介绍多种分布式框架及代码解析 课程实战:大模型微调实战——基于Qwen的大模型微调实战(1h) |
|
第三天-上午 1. 面向RAG的文档处理技术介绍(1h) 基于传统模型的文档数字化解析的技术原理与点滴 基于多模态文档解析:如PDF复杂表格识别、基于图片的直接问答交互等 文档综合拆解、版面分析相关算法推荐与面向RAG场景的段落拆解方法详述 2、大模型RAG核心技术分享 (1h) 大模型RAG整体框架梳理 向量数据库介绍——Faiss、Milvus、Pinecone、Weaviate等 大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与知识图谱等问答交互领域的应用与落地。 课程实战:大模型RAG搭建实战(1h) |
|
第三天-下午 1、课程互动与实践(1h) 针对工业企业与相关业务场景,分组互动,整理当前基于大模型的场景化落地方案与技术实现路径 2、大模型应用产品化及交付经验分享(1h) 介绍企业大模型场景化行业应用案例 大模型企业落地场景介绍,包括大模型与智能问答系统、大模型与知识库、大模型与智能编排等场景的应用与落地。 大模型在工业领域的交付案例详述,包括智能问数、智能问答、智能编排等场景中的交付案例 3. 交流与沟通(1h) 课后交流 |
近期公开课推荐