课程简介
2026年,AI技术进入“自主执行”时代,开源智能体平台Open Claw凭借其轻量架构与强大自动化能力,迅速成为全球开发者关注的工程标杆。本课程旨在帮助专业AI工程师超越应用层面,深入掌握Open Claw的核心设计思想与实现机制。以开源项目 OpenClaw(小龙虾)为例,深入浅出地剖析了 AI Agent 的底层运作原理,企业如何开发自己的OpenClaw. 课程聚焦智能体系统的工程化构建,为工程师面向未来自主智能体系统的自主研发与架构设计奠定技术基石。
为什么必须学习 OpenClaw ?
• 掌握智能体核心工程范式:深入理解Open Claw的任务调度、Skill扩展、本地优先等核心机制,把握自主智能体从“模型调用”到“行为控制”的工程本质。
• 构建可复用的Agent Skill开发框架:剖析Skill的设计哲学与实现细节,掌握通用化、模块化的智能体能力扩展方法,具备在企业内部自研智能体系统的技术储备。
• 抢占Agentic AI时代的架构先机:本课程面向具备开发基础的工程师,通过原理拆解与复现实践,培养从“使用者”到“架构定义者”的跃迁能力。
目标收益
1. 掌握Open Claw核心架构与运行机制:透彻理解任务调度、Skill扩展、上下文管理与跨系统交互的设计思想。
2. 具备独立设计与开发复杂Agent Skill的能力:能够根据业务需求,独立完成Skill的设计、调试与集成,拓展智能体应用边界。
3. 建立面向自主智能体系统的工程思维框架:通过对miniClaw的复现,掌握智能体系统设计的通用思想,为自研企业级智能体平台打下坚实基础。
培训对象
课程大纲
| 第1章:OpenClaw概览 |
1. OpenClaw概览:重新定义智能体操作系统—不仅仅是自动化工具,而是大模型能力的执行与编排平台。 2. 自动化范式的演进:从脚本自动化、RPA到基于大模型认知与决策的智能体驱动变革 3. OpenClaw初探: 定义、发展历史、核心设计哲学(开放性、灵活性)。 4. OpenClaw开放性:模型网关抽象、插件化架构、多模态能力扩展接口设计。 5. OpenClaw灵活性:声明式与命令式混合编程模型、事件驱动的任务编排、动态技能加载机制。 6. 能力边界: OpenClaw能做什么?从简单的GUI自动化到复杂的业务流编排。 7. 环境搭建与初体验: 安装部署、界面介绍、运行第一个Demo脚本。 |
| 第 2 章:OpenClaw实战部署与功能应用 |
1. 系统要求与环境准备:操作系统、依赖软件、网络配置 2. OpenClaw安装方式:一键安装包、Docker部署、源码编译 3. 中文版安装:本地化语言包、国内镜像加速、特殊配置 4. AI模型配置:接入OpenAI、本地大模型(Ollama)、Azure等 5. 验证安装:启动服务、查看日志、运行健康检查命令 |
| 第 3 章:OpenClaw操作界面与工作空间管理 |
1. OpenClawl控制台概览:仪表盘、任务列表、资源管理器 2. 工作空间概念:项目隔离、环境变量、团队协作基础 3. 创建工作空间与项目:组织代码、配置文件、依赖管理 4. 资源管理:上传/下载文件、管理知识库、维护插件 5. 版本控制集成:Git接入、分支管理、版本回滚 |
| 第 4 章:OpenClaw本地文件管理与个人知识库 |
1. 文件管理能力:列出目录、读写文件、创建删除、权限检查 2. 集成文件浏览器:在对话中交互式浏览本地文件 3. 知识库构建:将本地文档(PDF、Word、TXT)导入知识库 4. 知识库检索:基于向量检索的问答、相似文档推荐 5. 知识库维护:自动更新、增量索引、多知识库切换 |
| 第 5 章:OpenClaw定时任务与主动推送 |
1. 定时任务配置:Cron表达式、单次延迟任务、周期性任务 2. 任务触发器类型:时间触发、事件触发、条件触发 3. 主动推送能力:将结果推送到飞书、邮件、Webhook 4. 任务状态管理:查看任务列表、暂停/恢复/删除任务 5. 实战场景:每日报表自动推送、系统监控告警 |
| 第 6 章:OpenClaw多模态应用:图片生成与桌面截图视觉洞察 |
1. 多模态模型接入:多模态模型 2. 图片生成功能:根据描述生成图片、修改图片、风格迁移 3. 桌面截图实现:全屏截图、区域截图、定时截图 4. 视觉洞察:利用多模态模型识别截图内容、提取文字、分析图表 5. 应用案例:自动生成配图、监控屏幕变化并触发动作 |
| 第 7 章:OpenClaw全行业商业机会与落地场景解析 |
1. OpenClaw行业洞察: 金融、电商、政务、医疗等行业的自动化需求痛点。 2. OpenClaw场景实战分析: 3. 财务对账与报表自动化。 4. 跨系统数据迁移与录入。 5. 7x24小时无人值守监控。 6. ROI评估: 如何衡量OpenClaw引入后为企业带来的效率提升与成本降低。 |
| 第 8 章:OpenClaw 在软件研发领域的应用 |
1. OpenClaw辅助智能生成代码 2. OpenClaw辅助自动生成测试用例 3. OpenClaw辅助构建知识库与问答 4. OpenClaw辅助代码审查 5. OpenClaw辅助软件测试 6. OpenClaw辅助自动生成技术文档 7. OpenClaw辅助系统重构 8. OpenClaw辅助智能分析日志 |
| 第 9 章:OpenClaw 安全防范 |
1. OpenClaw 安全风险 2. 为什么你的OpenClaw需要安全防护 3. 三层防御体系总览 4. 三层防护体系应对四大安全挑战 5. 事前防线之红线与黄线命令 6. 事前防线之Skill安装安全审计 7. 事中防线之权限收窄与哈希基线 8. 事中防线之高危业务风控 9. 事后防线之每晚自动巡检 10. 灾备恢复与红蓝对抗演练 |
|
第10 章 Skills概念入门:定义、类比与价值 |
1. 什么是Skill:一个可执行的自动化任务单元,包含输入、处理、输出 2. Skill的类比:乐高积木(可组合)、手机APP(独立功能)、函数(可调用) 3. Skill的核心价值:复用、封装、解耦、生态共享 4. Skill的典型应用场景:数据提取、格式转换、API调用、UI操作 5. Skill的组成要素:元数据、代码/流程、依赖、配置 |
| 第 11 章 Skills深入原理:工作机制与核心特性 |
1. Skill运行沙箱:隔离环境、资源限制、安全策略 2. 数据交换协议:输入参数规范、输出结果格式、错误码定义 3. 事件驱动模型:Skill如何响应事件(消息、定时、系统事件) 4. 状态管理:Skill执行中的状态(运行、暂停、完成、失败) 5. 异常处理机制:捕获异常、重试策略、死信队列 |
|
第 12 章 开源资源宝库:如何寻找与复用现成Skills |
1. 主流开源社区:GitHub、Gitee、OpenClaw官方市场 2. 搜索技巧:关键词组合、过滤条件、评估Skill质量 3. 下载与安装:从市场一键安装、手动导入 4. 修改与定制:基于开源Skill进行二次开发 5. 贡献自己的Skill:发布规范、文档编写、社区互动 |
| 第 13 章 Agent业务Skills开发拓展与实战案例 |
1. 金融场景Skill:财报下载、数据提取、异常交易监控 2. 电商场景Skill:商品信息抓取、价格对比、订单处理 3. 办公场景Skill:会议纪要生成、邮件自动分类、文档审批流转 4. 跨系统集成:ERP与CRM数据同步Skill 5. 综合大作业:完成一个多Skill协同的完整业务流程 |
| 第 14 章:OpenClaw核心技术体系全维度拆解 |
1. OpenClaw的总体架构:控制器、执行器、资源库、通信层 2. 核心架构剖析: 控制器、执行器、资源库的协同工作机制。 3. 元素识别技术: 基于图像、控件、文本的混合识别引擎原理与适用场景。 4. 底层通信协议: OpenClaw如何与操作系统及第三方应用进行高效、稳定的交互。 5. 从消息输入到动作输出的完整流程:消息解析、意图识别、任务编排、执行反馈 6. 核心组件详解:消息队列、任务调度器、插件管理器 7. 设计哲学:模块化、可插拔、协议中立、安全优先 8. 对比分析:OpenClaw与传统RPA、其他自动化框架的异同。 |
| 第 15 章 OpenClaw网关与渠道适配器与路由级联 |
1. 网关的作用:统一入口、路由分发、协议转换、负载均衡 2. Lane机制原理:资源隔离、优先级调度、并发控制 3. 如何配置多Lane:业务分流、租户隔离、任务分级 4. 渠道适配器与路由级联:协议无关的架构 5. 渠道适配器设计模式:适配器接口规范、内置适配器列表(飞书、钉钉、微信、HTTP等) 6. 自定义适配器开发:实现新渠道接入的步骤与示例 7. 路由级联概念:多级路由转发、条件路由、动态路由 8. 消息格式标准化:统一内部消息结构,屏蔽渠道差异 9. 实战案例:同时接入飞书和钉钉,实现消息互通与处理 |
| 第 16 章:OpenClaw记忆系统:构建持久上下文 |
1. 记忆的分类:短期会话记忆、长期持久记忆、全局共享记忆 2. 记忆存储实现:内存数据库、关系数据库、向量数据库 3. 记忆检索机制:基于时间、关键词、向量相似度的检索 4. 记忆的维护:更新策略、过期清理、权限控制 5. 应用场景:多轮对话状态保持、用户画像积累、跨会话知识复用 |
| 第 17 章 Skills深入原理:工作机制与核心特性 |
1. Skill运行沙箱:隔离环境、资源限制、安全策略 2. 数据交换协议:输入参数规范、输出结果格式、错误码定义 3. 事件驱动模型:Skill如何响应事件(消息、定时、系统事件) 4. 状态管理:Skill执行中的状态(运行、暂停、完成、失败) 5. 异常处理机制:捕获异常、重试策略、死信队列 |
| 第 18 章 Mini-Claw智能体 开发需求 |
1. Mini-Claw功能与目标定位 2. Mini-Claw 是一个基于 Python 重构的、轻量级且高度透明的 AI Agent 系统,旨在复刻并优化OpenClaw的核心体验。 3. 本项目不追求构建庞大的 SaaS 平台,而是致力于打造一个运行在本地的、拥有“真实记忆”的数字副手。 4. 其核心差异化定位在于: 5. 文件即记忆 (File-first Memory):摒弃不透明的向量数据库,回归最原始、最通用的Markdown/JSON 文件系统。用户的每一次对话、Agent 的每一次反思,都以人类可读的文件形式存在。 6. 技能即插件 (Skills as Plugins):遵循 Anthropic 的 Agent Skills 范式,通过文件夹结构管理能力,实现“拖入即用”的技能扩展。 7. 透明可控:所有的 System Prompt 拼接逻辑、工具调用过程、记忆读写操作对开发者完全透明,拒绝“黑盒”Agent。 |
| 第 19 章 Mini-Claw智能体核心技术架构 |
1. Mini-Claw智能体项目要求完全采用 前后端分离 架构,后端作为纯 API 服务运行。 2. 后端语言:Python /Web 框架:FastAPI (提供 RESTful 接口,支持异步处理)。 3. Agent 编排引擎:LangChain 1.x (Stable Release)。 4. 核心 API:基于 LangChain 和langGraph 运行时的 Agent。 5. RAG 检索引擎:LlamaIndex (LlamaIndex Core)。 6. 用于处理非结构化文档的混合检索(Hybrid Search),作为 Agent 的知识外挂。 7. 模型接口:兼容 OpenAI API 格式(支持 OpenRouter, DeepSeek, Claude 等模型直连)。 8. 数据存储:本地文件系统 (Local File System) 为主,不引入 MySQL/Redis 等重型依赖。 |
|
第1章:OpenClaw概览 1. OpenClaw概览:重新定义智能体操作系统—不仅仅是自动化工具,而是大模型能力的执行与编排平台。 2. 自动化范式的演进:从脚本自动化、RPA到基于大模型认知与决策的智能体驱动变革 3. OpenClaw初探: 定义、发展历史、核心设计哲学(开放性、灵活性)。 4. OpenClaw开放性:模型网关抽象、插件化架构、多模态能力扩展接口设计。 5. OpenClaw灵活性:声明式与命令式混合编程模型、事件驱动的任务编排、动态技能加载机制。 6. 能力边界: OpenClaw能做什么?从简单的GUI自动化到复杂的业务流编排。 7. 环境搭建与初体验: 安装部署、界面介绍、运行第一个Demo脚本。 |
|
第 2 章:OpenClaw实战部署与功能应用 1. 系统要求与环境准备:操作系统、依赖软件、网络配置 2. OpenClaw安装方式:一键安装包、Docker部署、源码编译 3. 中文版安装:本地化语言包、国内镜像加速、特殊配置 4. AI模型配置:接入OpenAI、本地大模型(Ollama)、Azure等 5. 验证安装:启动服务、查看日志、运行健康检查命令 |
|
第 3 章:OpenClaw操作界面与工作空间管理 1. OpenClawl控制台概览:仪表盘、任务列表、资源管理器 2. 工作空间概念:项目隔离、环境变量、团队协作基础 3. 创建工作空间与项目:组织代码、配置文件、依赖管理 4. 资源管理:上传/下载文件、管理知识库、维护插件 5. 版本控制集成:Git接入、分支管理、版本回滚 |
|
第 4 章:OpenClaw本地文件管理与个人知识库 1. 文件管理能力:列出目录、读写文件、创建删除、权限检查 2. 集成文件浏览器:在对话中交互式浏览本地文件 3. 知识库构建:将本地文档(PDF、Word、TXT)导入知识库 4. 知识库检索:基于向量检索的问答、相似文档推荐 5. 知识库维护:自动更新、增量索引、多知识库切换 |
|
第 5 章:OpenClaw定时任务与主动推送 1. 定时任务配置:Cron表达式、单次延迟任务、周期性任务 2. 任务触发器类型:时间触发、事件触发、条件触发 3. 主动推送能力:将结果推送到飞书、邮件、Webhook 4. 任务状态管理:查看任务列表、暂停/恢复/删除任务 5. 实战场景:每日报表自动推送、系统监控告警 |
|
第 6 章:OpenClaw多模态应用:图片生成与桌面截图视觉洞察 1. 多模态模型接入:多模态模型 2. 图片生成功能:根据描述生成图片、修改图片、风格迁移 3. 桌面截图实现:全屏截图、区域截图、定时截图 4. 视觉洞察:利用多模态模型识别截图内容、提取文字、分析图表 5. 应用案例:自动生成配图、监控屏幕变化并触发动作 |
|
第 7 章:OpenClaw全行业商业机会与落地场景解析 1. OpenClaw行业洞察: 金融、电商、政务、医疗等行业的自动化需求痛点。 2. OpenClaw场景实战分析: 3. 财务对账与报表自动化。 4. 跨系统数据迁移与录入。 5. 7x24小时无人值守监控。 6. ROI评估: 如何衡量OpenClaw引入后为企业带来的效率提升与成本降低。 |
|
第 8 章:OpenClaw 在软件研发领域的应用 1. OpenClaw辅助智能生成代码 2. OpenClaw辅助自动生成测试用例 3. OpenClaw辅助构建知识库与问答 4. OpenClaw辅助代码审查 5. OpenClaw辅助软件测试 6. OpenClaw辅助自动生成技术文档 7. OpenClaw辅助系统重构 8. OpenClaw辅助智能分析日志 |
|
第 9 章:OpenClaw 安全防范 1. OpenClaw 安全风险 2. 为什么你的OpenClaw需要安全防护 3. 三层防御体系总览 4. 三层防护体系应对四大安全挑战 5. 事前防线之红线与黄线命令 6. 事前防线之Skill安装安全审计 7. 事中防线之权限收窄与哈希基线 8. 事中防线之高危业务风控 9. 事后防线之每晚自动巡检 10. 灾备恢复与红蓝对抗演练 |
|
第10 章 Skills概念入门:定义、类比与价值 1. 什么是Skill:一个可执行的自动化任务单元,包含输入、处理、输出 2. Skill的类比:乐高积木(可组合)、手机APP(独立功能)、函数(可调用) 3. Skill的核心价值:复用、封装、解耦、生态共享 4. Skill的典型应用场景:数据提取、格式转换、API调用、UI操作 5. Skill的组成要素:元数据、代码/流程、依赖、配置 |
|
第 11 章 Skills深入原理:工作机制与核心特性 1. Skill运行沙箱:隔离环境、资源限制、安全策略 2. 数据交换协议:输入参数规范、输出结果格式、错误码定义 3. 事件驱动模型:Skill如何响应事件(消息、定时、系统事件) 4. 状态管理:Skill执行中的状态(运行、暂停、完成、失败) 5. 异常处理机制:捕获异常、重试策略、死信队列 |
|
第 12 章 开源资源宝库:如何寻找与复用现成Skills 1. 主流开源社区:GitHub、Gitee、OpenClaw官方市场 2. 搜索技巧:关键词组合、过滤条件、评估Skill质量 3. 下载与安装:从市场一键安装、手动导入 4. 修改与定制:基于开源Skill进行二次开发 5. 贡献自己的Skill:发布规范、文档编写、社区互动 |
|
第 13 章 Agent业务Skills开发拓展与实战案例 1. 金融场景Skill:财报下载、数据提取、异常交易监控 2. 电商场景Skill:商品信息抓取、价格对比、订单处理 3. 办公场景Skill:会议纪要生成、邮件自动分类、文档审批流转 4. 跨系统集成:ERP与CRM数据同步Skill 5. 综合大作业:完成一个多Skill协同的完整业务流程 |
|
第 14 章:OpenClaw核心技术体系全维度拆解 1. OpenClaw的总体架构:控制器、执行器、资源库、通信层 2. 核心架构剖析: 控制器、执行器、资源库的协同工作机制。 3. 元素识别技术: 基于图像、控件、文本的混合识别引擎原理与适用场景。 4. 底层通信协议: OpenClaw如何与操作系统及第三方应用进行高效、稳定的交互。 5. 从消息输入到动作输出的完整流程:消息解析、意图识别、任务编排、执行反馈 6. 核心组件详解:消息队列、任务调度器、插件管理器 7. 设计哲学:模块化、可插拔、协议中立、安全优先 8. 对比分析:OpenClaw与传统RPA、其他自动化框架的异同。 |
|
第 15 章 OpenClaw网关与渠道适配器与路由级联 1. 网关的作用:统一入口、路由分发、协议转换、负载均衡 2. Lane机制原理:资源隔离、优先级调度、并发控制 3. 如何配置多Lane:业务分流、租户隔离、任务分级 4. 渠道适配器与路由级联:协议无关的架构 5. 渠道适配器设计模式:适配器接口规范、内置适配器列表(飞书、钉钉、微信、HTTP等) 6. 自定义适配器开发:实现新渠道接入的步骤与示例 7. 路由级联概念:多级路由转发、条件路由、动态路由 8. 消息格式标准化:统一内部消息结构,屏蔽渠道差异 9. 实战案例:同时接入飞书和钉钉,实现消息互通与处理 |
|
第 16 章:OpenClaw记忆系统:构建持久上下文 1. 记忆的分类:短期会话记忆、长期持久记忆、全局共享记忆 2. 记忆存储实现:内存数据库、关系数据库、向量数据库 3. 记忆检索机制:基于时间、关键词、向量相似度的检索 4. 记忆的维护:更新策略、过期清理、权限控制 5. 应用场景:多轮对话状态保持、用户画像积累、跨会话知识复用 |
|
第 17 章 Skills深入原理:工作机制与核心特性 1. Skill运行沙箱:隔离环境、资源限制、安全策略 2. 数据交换协议:输入参数规范、输出结果格式、错误码定义 3. 事件驱动模型:Skill如何响应事件(消息、定时、系统事件) 4. 状态管理:Skill执行中的状态(运行、暂停、完成、失败) 5. 异常处理机制:捕获异常、重试策略、死信队列 |
|
第 18 章 Mini-Claw智能体 开发需求 1. Mini-Claw功能与目标定位 2. Mini-Claw 是一个基于 Python 重构的、轻量级且高度透明的 AI Agent 系统,旨在复刻并优化OpenClaw的核心体验。 3. 本项目不追求构建庞大的 SaaS 平台,而是致力于打造一个运行在本地的、拥有“真实记忆”的数字副手。 4. 其核心差异化定位在于: 5. 文件即记忆 (File-first Memory):摒弃不透明的向量数据库,回归最原始、最通用的Markdown/JSON 文件系统。用户的每一次对话、Agent 的每一次反思,都以人类可读的文件形式存在。 6. 技能即插件 (Skills as Plugins):遵循 Anthropic 的 Agent Skills 范式,通过文件夹结构管理能力,实现“拖入即用”的技能扩展。 7. 透明可控:所有的 System Prompt 拼接逻辑、工具调用过程、记忆读写操作对开发者完全透明,拒绝“黑盒”Agent。 |
|
第 19 章 Mini-Claw智能体核心技术架构 1. Mini-Claw智能体项目要求完全采用 前后端分离 架构,后端作为纯 API 服务运行。 2. 后端语言:Python /Web 框架:FastAPI (提供 RESTful 接口,支持异步处理)。 3. Agent 编排引擎:LangChain 1.x (Stable Release)。 4. 核心 API:基于 LangChain 和langGraph 运行时的 Agent。 5. RAG 检索引擎:LlamaIndex (LlamaIndex Core)。 6. 用于处理非结构化文档的混合检索(Hybrid Search),作为 Agent 的知识外挂。 7. 模型接口:兼容 OpenAI API 格式(支持 OpenRouter, DeepSeek, Claude 等模型直连)。 8. 数据存储:本地文件系统 (Local File System) 为主,不引入 MySQL/Redis 等重型依赖。 |
近期公开课推荐