课程简介
随着市场竞争的加剧、企业信息化的深入以及IT技术的发展,各企事业单位逐步意识到传统的经营手段和运营方式已经不能满足当前商业环境的竞争要求,纷纷考虑借助创新的IT手段和方法以提升自身的竞争优势。如何从企业内部众多的信息系统中提取真正反映企业运营状况的有效信息、深入挖掘价值客户群体等信息,从而为市场经营决策提供科学支持,以期对纷繁变化的市场有一定的洞察力、掌控力和预判力便成为各大企业下一阶段信息系统建设的目标和方向。而这一目标正是要靠IT领域中的数据仓库和商业智能技术来实现和达到。
本次课程将介绍数据仓库和商业智能技术的基本理论和体系架构,通过大型数据仓库和商业智能项目案例阐述数据仓库和商业智能项目的实施过程和方法。通过实际应用案例介绍多维数据模型、粒度、立方体及元数据等重要概念。详细讲解构建数据仓库和商业智能体系的核心方法和技术,并模拟搭建基本的数据仓库和商业智能环境。熟悉主流数据仓库和商业智能厂商及了解相关软件产品的操作和使用。
目标收益
1、 通过完整项目案例,客户将学会数据仓库设计和实施的标准方法
2、 客户将学会如何分析问题,如何快速开发本行业的数据仓库项目
3、 客户将学会解决数据仓库实施过程中所遇到的重点和难点问题4、 通过动手实验,客户将学会微软商业智能相关工具的操作使用
5、 客户将学习最新数据仓库和商业智能领域的前沿技术
培训对象
课程大纲
专题一: 数据仓库基础知识 |
简述: 介绍数据仓库基本概念,BI体系架构,以及SQL Server 2008 BI工具介绍及其应用,针对行业提供行业解决方案和案例分析。 内容一:BI的架构 1、BI体系介绍 2、ETL介绍 3、多维数据库介绍 4、前端展现介绍 5、数据挖掘介绍 内容二: SQL Server BI工具介绍 1、ETL工具---SSIS介绍 2、OLAP工具---SSAS介绍 3、报表工具---SSRS介绍 4、数据挖掘工具---SSAS中的挖掘模型 内容三、BI在行业中的应用 1、现代企业BI需求概述 2、互联网行业案例分析 3、生产制造行业案例研究 4、医药行业案例分析 5、BI系统数据更新与维护 |
专题二: ETL设计部分 |
简述: 介绍数据集成和数据整合相关技术,对ETL设计和开发进行讲解,重点讲解微软ETL工具---SSIS组件的功能与设计开发,详细介绍各控件的功能和开发技巧以及变量的创建与使用以及创建SSIS包等。 内容一、SSIS 简介 1、控制流介绍 2、数据流介绍 3、事件处理 4、包浏览器 内容二、控制流任务组件详解 1、循环容器 2、执行SQL任务 3、文件系统任务 4、执行进程任务 5、执行包任务 6、脚本任务 7、发送邮件任务 内容三:数据流任务组件详解 1、条件拆分 2、数据转换 3、派生列 4、排序 5、缓慢变化维度 6、合并联接 7、分播 8、查找和模糊查找 9、分组和模糊分组 内容四:创建SSIS包 1、创建控制流任务 2、创建数据流任务 3、使用数据源和数据源视图 4、使用变量 5、使用约束 6、使用表达式 7、使用连接管理器 |
专题三: 海量数据优化部分 |
简述: 海量数据的概念、特点以及海量数据的优化方法,数据仓库项目中海量数据的处理方式以及海量数据的高级应用等,针对大型数据仓库项目提供了完备的海量数据优化方案。 内容一:海量数据的特点 1、什么是海量数据 2、海量数据的特点 3、海量数据与行业应用 内容二:16种海量数据优化方法详解 1、海量数据分区处理 2、使用中间表和临时表 3、分批次处理 4、建立广泛的索引 5、建立缓存机制 6、使用文本和二进制格式进行处理 7、定制强大的清洗规则和出错处理机制 8、建立视图或者物化视图 9、其他优化方法 内容三:数据仓库中海量数据的处理方式 1、数据仓库中的海量数据特点 2、数据仓库中的海量数据的处理方式 3、分布式数据仓库的特点及应用 内容四:海量数据高级应用 1、大型项目中海量数据的优化案例分析 2、使用海量数据优化工具 3、数据仓库的性能调优技巧 |
专题四: 数据仓库项目案例分析 |
简述: 大型数据仓库项目设计和实施,重点对项目架构设计和数据完整处理流程做重点分析和详细介绍,针对大型数据仓库项目,提供了完备的异构数据源集成方案,以及ODS和缓慢变化维度等的应用技巧。 内容一:Novartis大型数据仓库项目 1、项目介绍 2、复杂多系统多数据源的特点 3、ODS的使用 4、整体项目架构设计 5、ETL流程设计 6、缓慢变化维度的使用 7、抽取策略的制定 8、数据仓库更新技巧 内容二:Search Funnel数据仓库设计 1、项目介绍 2、项目中的海量数据 3、ETL流程中的程序设计 4、如何设计抽取策略 内容三:AdventureWorks数据仓库流程详解 1、案例介绍 2、ETL流程详解 3、SSAS流程详解 4、SSRS流程详解 |
专题五: 构建多维 数据库 |
简述: 多维数据库相关概念,功能介绍,搭建CUBE的流程和SQL Server 2008新增功能详细介绍、MDX和SSAS的高级特性、使用技巧等。 内容一:创建多维数据库 1、定义数据源 2、定义数据源视图 3、创建维度 4、创建多维数据集 5、设置量度组成员 内容二:统一维度模型(UDM) 1、定义业务实体 2、定义业务逻辑 3、定义计算成员 内容三:MDX语言 1、MDX概念 2、MDX语法结构 3、MDX的查询功能 4、使用MDX定制商务逻辑 5、MDX复杂案例分析 6、MDX与权限管理 内容四:OLAP的聚合方式 1、ROLAP聚合方式 2、MOLAP聚合方式 3、HOLAP聚合方式 内容五:SSAS高级特性 1、维度层次 2、货币转换 3、本地化 4、使用文件夹 5、透视 6、使用Action 7、关键性能指标(KPI) |
专题六: 前端报表 展现分析 |
简述:报表相关概念,SSRS,ProClarity功能介绍,Report Model,Report Builder等的开发使用,SSRS与第三方软件的比较及集成等。 内容一:使用Report Model开发报表 1、Report Model介绍 2、创建数据源 3、使用报表控件 4、使用参数 5、使用级连报表 内容二:使用Report Builder开发报表 1、Report Builder介绍 2、创建数据源 3、使用向导 4、使用参数 内容三:使用二维表数据源设计报表 1、数据源的特点 2、设计报表 3、根据数据源更新报表 内容四:报表管理 1、权限管理 2、角色定义 3、报表配置 内容五:报表分发和定制 1、报表分发 2、报表定制 |
专题七: 数据挖掘 相关技术 |
简述: 数据挖掘相关概念,SQL Server 9种挖掘算法介绍,数据挖掘模型应用和关键挖掘模型的设计、开发和相关工具的使用等。 内容一:SQL Server 九种新型数据挖掘算法模型 1、 九种挖掘算法模型应用的背景 2、 决策树算法与模型设计 3、 聚类算法与模型设计 4、 关联规则算法与模型设计 5、 贝叶斯算法与模型设计 6、 时间序列算法与模型设计 7、 其他挖掘算法与模型设计 内容二:常用挖掘模型详解 1、决策树算法详解及工具实现 2、聚类算法详解及工具实现 3、关联规则算法详解及工具实现 4、贝叶斯算法详解及工具实现 5、时间序列算法详解及工具实现 6、数据挖掘模型评估 内容三:DMX语言 1、DMX语法结构 2、使用DMX将挖掘结果导出 3、使用DMX进行参数设置 内容四:挖掘模型与SSIS的整合 1、数据挖掘查询任务 2、数据挖掘模型训练任务 3、SSAS处理任务中的挖掘模型处理 内容五:基于挖掘模型的二次开发 1、CS结构的开发 2、BS结构的开发 |
专题一: 数据仓库基础知识 简述: 介绍数据仓库基本概念,BI体系架构,以及SQL Server 2008 BI工具介绍及其应用,针对行业提供行业解决方案和案例分析。 内容一:BI的架构 1、BI体系介绍 2、ETL介绍 3、多维数据库介绍 4、前端展现介绍 5、数据挖掘介绍 内容二: SQL Server BI工具介绍 1、ETL工具---SSIS介绍 2、OLAP工具---SSAS介绍 3、报表工具---SSRS介绍 4、数据挖掘工具---SSAS中的挖掘模型 内容三、BI在行业中的应用 1、现代企业BI需求概述 2、互联网行业案例分析 3、生产制造行业案例研究 4、医药行业案例分析 5、BI系统数据更新与维护 |
专题二: ETL设计部分 简述: 介绍数据集成和数据整合相关技术,对ETL设计和开发进行讲解,重点讲解微软ETL工具---SSIS组件的功能与设计开发,详细介绍各控件的功能和开发技巧以及变量的创建与使用以及创建SSIS包等。 内容一、SSIS 简介 1、控制流介绍 2、数据流介绍 3、事件处理 4、包浏览器 内容二、控制流任务组件详解 1、循环容器 2、执行SQL任务 3、文件系统任务 4、执行进程任务 5、执行包任务 6、脚本任务 7、发送邮件任务 内容三:数据流任务组件详解 1、条件拆分 2、数据转换 3、派生列 4、排序 5、缓慢变化维度 6、合并联接 7、分播 8、查找和模糊查找 9、分组和模糊分组 内容四:创建SSIS包 1、创建控制流任务 2、创建数据流任务 3、使用数据源和数据源视图 4、使用变量 5、使用约束 6、使用表达式 7、使用连接管理器 |
专题三: 海量数据优化部分 简述: 海量数据的概念、特点以及海量数据的优化方法,数据仓库项目中海量数据的处理方式以及海量数据的高级应用等,针对大型数据仓库项目提供了完备的海量数据优化方案。 内容一:海量数据的特点 1、什么是海量数据 2、海量数据的特点 3、海量数据与行业应用 内容二:16种海量数据优化方法详解 1、海量数据分区处理 2、使用中间表和临时表 3、分批次处理 4、建立广泛的索引 5、建立缓存机制 6、使用文本和二进制格式进行处理 7、定制强大的清洗规则和出错处理机制 8、建立视图或者物化视图 9、其他优化方法 内容三:数据仓库中海量数据的处理方式 1、数据仓库中的海量数据特点 2、数据仓库中的海量数据的处理方式 3、分布式数据仓库的特点及应用 内容四:海量数据高级应用 1、大型项目中海量数据的优化案例分析 2、使用海量数据优化工具 3、数据仓库的性能调优技巧 |
专题四: 数据仓库项目案例分析 简述: 大型数据仓库项目设计和实施,重点对项目架构设计和数据完整处理流程做重点分析和详细介绍,针对大型数据仓库项目,提供了完备的异构数据源集成方案,以及ODS和缓慢变化维度等的应用技巧。 内容一:Novartis大型数据仓库项目 1、项目介绍 2、复杂多系统多数据源的特点 3、ODS的使用 4、整体项目架构设计 5、ETL流程设计 6、缓慢变化维度的使用 7、抽取策略的制定 8、数据仓库更新技巧 内容二:Search Funnel数据仓库设计 1、项目介绍 2、项目中的海量数据 3、ETL流程中的程序设计 4、如何设计抽取策略 内容三:AdventureWorks数据仓库流程详解 1、案例介绍 2、ETL流程详解 3、SSAS流程详解 4、SSRS流程详解 |
专题五: 构建多维 数据库 简述: 多维数据库相关概念,功能介绍,搭建CUBE的流程和SQL Server 2008新增功能详细介绍、MDX和SSAS的高级特性、使用技巧等。 内容一:创建多维数据库 1、定义数据源 2、定义数据源视图 3、创建维度 4、创建多维数据集 5、设置量度组成员 内容二:统一维度模型(UDM) 1、定义业务实体 2、定义业务逻辑 3、定义计算成员 内容三:MDX语言 1、MDX概念 2、MDX语法结构 3、MDX的查询功能 4、使用MDX定制商务逻辑 5、MDX复杂案例分析 6、MDX与权限管理 内容四:OLAP的聚合方式 1、ROLAP聚合方式 2、MOLAP聚合方式 3、HOLAP聚合方式 内容五:SSAS高级特性 1、维度层次 2、货币转换 3、本地化 4、使用文件夹 5、透视 6、使用Action 7、关键性能指标(KPI) |
专题六: 前端报表 展现分析 简述:报表相关概念,SSRS,ProClarity功能介绍,Report Model,Report Builder等的开发使用,SSRS与第三方软件的比较及集成等。 内容一:使用Report Model开发报表 1、Report Model介绍 2、创建数据源 3、使用报表控件 4、使用参数 5、使用级连报表 内容二:使用Report Builder开发报表 1、Report Builder介绍 2、创建数据源 3、使用向导 4、使用参数 内容三:使用二维表数据源设计报表 1、数据源的特点 2、设计报表 3、根据数据源更新报表 内容四:报表管理 1、权限管理 2、角色定义 3、报表配置 内容五:报表分发和定制 1、报表分发 2、报表定制 |
专题七: 数据挖掘 相关技术 简述: 数据挖掘相关概念,SQL Server 9种挖掘算法介绍,数据挖掘模型应用和关键挖掘模型的设计、开发和相关工具的使用等。 内容一:SQL Server 九种新型数据挖掘算法模型 1、 九种挖掘算法模型应用的背景 2、 决策树算法与模型设计 3、 聚类算法与模型设计 4、 关联规则算法与模型设计 5、 贝叶斯算法与模型设计 6、 时间序列算法与模型设计 7、 其他挖掘算法与模型设计 内容二:常用挖掘模型详解 1、决策树算法详解及工具实现 2、聚类算法详解及工具实现 3、关联规则算法详解及工具实现 4、贝叶斯算法详解及工具实现 5、时间序列算法详解及工具实现 6、数据挖掘模型评估 内容三:DMX语言 1、DMX语法结构 2、使用DMX将挖掘结果导出 3、使用DMX进行参数设置 内容四:挖掘模型与SSIS的整合 1、数据挖掘查询任务 2、数据挖掘模型训练任务 3、SSAS处理任务中的挖掘模型处理 内容五:基于挖掘模型的二次开发 1、CS结构的开发 2、BS结构的开发 |