商家名称 | 信用等级 | 购买信息 | 订购本书 |
SQL Server2005Integration Services专家教程(耐特著) | |||
SQL Server2005Integration Services专家教程(耐特著) |
《SQL Server2005Integration Services专家教程》适用于有经验的SQL Servel 数据库开发人员、架构师和想使用SSIS构建ETL应用程序的管理人员。
作者:(美国)耐特 (Knight.B.) (美国)弗尔曼 (Veerman.E.) 译者:冯飞
Brian Knight(SQL Server MVP、MCSE、MCDBA),来自佛罗里达州绿湾泉,是SQLServerCentral.com和JumpstartTV.com的共同创始人。他在JacksonvillefJSSuG)开办了一个本地的SQL Server用户组,并且是Professional Association for SQL Server(PASS)的董事会成员。他是SQL Server Standard的专栏作家,也负责数据库网站SQLServerCentral.corn的一个专栏,并在JumpstartTV.com上定期发表评论。他分别与人合著和独著了9本SQLServer的书籍,包括Admin911:SQL Server 2000(McGraw-Hill Companies),Professional SQLServer 2000 DTS(Wiley Publishing),,Professional SQL Server 2005 Administration(WileyPublishing),和Professional SQL Server 2005 Integration Services(Wiley Publishing)。他还在PASS、SQL Connections和TechEd等会议以及许多Code Camps中作演讲。他的博客地址为www.whiteknighttechnology.com。
Erik Veerman(SQL Server MVP、MCSE、MCDBA)是Solid Quality Learning的顾问,专职于SQL Server Business Intelligence(BI)-平台上的培训、部署和架构解决方案工作。他是Microsoft的Worldwide BI Solution of the Year以及SQL Server Magazine的Innovator Cup获得者。他设计了大量跨广泛业务范围的BI解决方案,涉及通信、市场营销、零售、商业房产、金融、供应链和信息技术等。他有着大数据量、多TB的环境以及SQL Server(64位)方面的经验,使得客户可伸缩他们基于Microsoft的BI解决方案以达到最优。作为OLAP设计、ETL处理和维度建模方面的专家,他是先驱者、作家和指导者。他领导了第一次用SQL Server Integration Services(SSIS)实现ETL体系结构和设计,帮助在Microsoft的SQLServer 2005 reference initiative(Project REAL)上推动ETL标准和SSIS的最好实践。他还是Profession SQL Server 2005 Integration Services(Wiley Publishing,2006)一书的合著者。他居住在乔治亚州的亚特兰大,是本地Atlanta SQL Server用户组(PASS和INETA用户组分支机构)的负责人。
第1章 绪言
1.1 选择合适的工具
1.1.1 数据仓储ETL
1.1.2 数据集成
1.1.3 SSIS管理
1.2 SSIS的回顾
1.2.1 创建连接管理器
1.2.2 使用控制流
1.2.3 使用数据流
1.2.4 优先级约束
1.2.5 程序包执行
1.2.6 容器
1.2.7 回顾总结
1.3 小结
第2章 扩展SSlS中的脚本
2.1 ScriptTasks和自定义库
2.1.1 用户定义的变量
2.1.2 通过代码检索变量
2.1.3 访问数据流中的变量
2.2 构建一个自定义程序集
2.2.1 通过HTTP下载文件
2.2.2 将程序集添加到GAC
2.3 使连接成为可配置的和动态的
2.4 引发错误事件
2.5 通过ScriptComponent加密数据
2.6 数据剖析
2.7 小结
第3章 数据提取
3.1 程序包连接和数据流源
3.1.1 源适配器
3.1.2 高级功能和概念
3.1.3 优化的数据分段方法
3.2 增量数据提取
3.2.1 使用一个变化标识符值增量提取
3.2.2 从不带有触发器的SQLServer中进行增量提取
3.2.3 使用SSIS处理增量提取的各方面
3.3 跟踪数据谱系标识符
3.4 小结
第4章 使用SSIS进行维度ETL
4.1 维度ETL概览
4.2 维度基本知识
4.3 维度ETL的挑战
4.3.1 为维度ETL准备数据
4.3.2 维度变化类型
4.4 SSIS的SlowlyChangingDimensionWizard
4.4.1 SCD的高级属性和其他输出
4.4.2 渐变维度向导的优缺点
4.4.3 优化内置的渐变维度支持
4.4.4 带有渐变维度支持的高级维度处理
4.5 创建一个自定义的渐变程序包
4.5.1 连接源数据和维度数据
4.5.2 确定维度变化
4.5.3 处理维度插入和更新
4.6 小结
第5章 事实表ETL
5.1 事实表概览
5.1.1 映射维度键
5.1.2 计算度量
5.1.3 添加元数据
5.1.4 事实表类型
5.2 事实表ETL
5.3 事实表ETL的难点
5.4 事实表ETL的基础知识
5.4.1 获取维度代理键
5.4.2 度量计算
5.4.3 管理事实表变化
5.5 高级事实表ETL概念
5.5.1 管理事实表粒度
5.5.2 粒度改变的SSIS示例
5.5.3 处理缺少维度查找
5.5.4 处理迟到事实
5.5.5 高级事实表加载
5.6 小结
第6章 通过SSlS处理AnaIvsisSenices对象
6.1 SSASETL处理和管理概述
6.1.1 SSAS对象和处理基础
6.1.2 通过SSIS处理SSAS对象的方法
6.1.3 分区的创建和修改
6.2 SSIS中SSAS集成的基础知识
6.2.1 SSAS的控制流任务
6.2.2 SSAS对象的数据流目标
6.3 高级处理和分区管理的示例
6.3.1 维度的处理
6.3.2 分区的创建和处理
6.3.3 分区管理
6.3.4 处理来自非SQLServer源的SSAS立方体.
6.3.5 特性关系上类型l、类型2以及推断成员的含义
6.4 小结
第7章 程序包的可靠性
7.1 错误和事件处理
7.1.1 事件处理程序的类型
7.1.2 通过事件处理程序进行审核
7.1.3 禁止事件处理功能
7.1.4 将快照集成到SSIS中
7.2 日志记录
7.2.1 创建唯一的日志文件
7.2.2 关于日志记录提供器的报告
7.3 检查点文件
7.3.1 动态化检查点文件名
7.3.2 错误逻辑的测试
7.4 事务
7.5 原始文件
7.6 前摄的WMI集成(ProactiVeWMIIntegration)
7.7 FilewatcherTask的构建
7.8 小结
第8章 部署
8.1 与ssIs中的团队一起工作
8.1.1 源控制集成
8.1.2 添加新项目
8.2 可重用的程序包
8.3 程序包模板的创建
8.4 程序包的配置
8.4.1 SSIS程序包配置
8.4.2 配置知识库
8.5 部署实用程序
8.6 小结
第9章 SSlS的管理
9.1 PackageStore
9.1.1 SSIS中央服务器的创建
9.1.2 SSIS的群集
9.1.3 文件系统或msdb部署
9.2 ManagementStudiO
9.3 通过DTExecUI来运行程序包.
9.4 安全性
9.5 防火墙问题
9.6 命令行实用程序
9.6.1 DTExec.exe
9.6.2 DTUtil.exe
9.7 程序包的调度
9.8 代理账户
9.9 64位的问题
9.1 0性能计数器
9.1 1小结
第10章 异构数据和不寻常数据的处理
10.1 不寻常数据流的情形
10.1.1 通过列来创建行
10.1.2 单个文件中的多个记录类型
10.1.3 原始文件的使用
10.2 Oracle
10.2.1 从Oracle中读取数据
lO.2.2 把数据写到Oracle中
10.3 其他的数据源
10.3.1 DB2
10.3.2 VSAM
10.4 小结
第11章 从DTS迁移到SSIS
11.1 SQLServer2005DTS的向后兼容性
11.2 DTS程序包的管理和编辑
11.3 从DTS升级
11.3.1 IJpgradeAdvisor
11.3.2 MigrationWizard
11.4 例外情况的处理
11.4.1 DynamicPropertiesrask
1.4.2 ComplexT'ransformDataFasks
11.4.3 FlatFileConnectionManager
11..4.4 ActiveXScriptTask
11.5 小结
第12章 扩展SSIS
12.1 概述
12.2 SSIS可伸缩性的基础
12.2.1 SSIS服务的状态
12.2.2 确定任务的持续时间
12.2.3 内存的利用率
12.2.4 SQL操作和数据流之间的平衡
12.3 数据流的优化
12.3.1 管道体系结构的回顾
12.3.2 普通的管道优化
12.3.3 数据流的属性
12.3.4 目标的优化
12.4 程序包执行的原则
12.4.1 “程序包的存储位置”对“执行位置”
12.4.2.ExecuteSQLTask和BulkInsertFaskExecution
12.4.3 程序包执行和数据流
12.4.4 源或目标服务器上的程序包执行
12.4.5 单独的SSIS服务器
12.4.6 分布式的程序包执行
12.5 小结
曾有一些书介绍过SQL Server Integration Services(SSIS)——事实上,本书的前篇Professional SQL Servet 2005 Integration Services(Indianapolis:Wiley,2006)就对此工具作了详细介绍。不过,尽管许多相关技术书籍都写得很好,也是初次尝试时极好的参考指导,但将这一技术应用于解决方案并不是那么简单的事情。
例如,您在当地五金店购买的电动工具都会带有用户手册。但仅看一眼目录索引即可知道,手册的目的只是介绍工具的旋钮和按钮。例如电动锯的手册就可能会描述如何抬升和降低锯条,如何弯曲手臂来切45。角。但往往不会介绍如何学习制造柜子或床。显然,您不能指望手册来教会您这一切,特别是如果该电动锯有成百种不同的用途,那就更不可能了。
正如您所料,SSIS的情况与之类似。目前的在线文档和SSIS书籍很好地讲述了如何使用FTP任务,如从远程服务器中拖文件,以及如何连接文件将数据提取到表中。但它们并没有介绍如何整合这些内容,将SSIS应用于特定目的。当然,SSIS的许多用户很高兴地发现可根据在线文档实现一些标准的一次性任务。但在使用该工具构建解决方案时,需要更多的信息。
本书有关于应用——即应用SSIS的功能帮助预想、开发和实现数据处理需求。
插图:
相关阅读:
更多图书资讯可访问读书人图书频道:http://www.reAder8.cn/book/