首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 图书频道 > 计算机与网络 > 数据库 >

数据挖掘原理与应用(第2版):SQL Server 2008数据库 [平装]

2014-03-05 
编辑推荐《数据挖掘原理与应用(第2版):SQL Server 2008数据库》:SQL Server数据挖掘是业界使用最广泛的数据挖
商家名称 信用等级 购买信息 订购本书
数据挖掘原理与应用(第2版):SQL Server 2008数据库 [平装] 去商家看看
数据挖掘原理与应用(第2版):SQL Server 2008数据库 [平装] 去商家看看

数据挖掘原理与应用(第2版):SQL Server 2008数据库 [平装]

编辑推荐

《数据挖掘原理与应用(第2版):SQL Server 2008数据库》:SQL Server数据挖掘是业界使用最广泛的数据挖掘服务器。企业用户(甚至学术专家和科学家)都采用SQL Server数据挖掘技术,因为这种技术的可伸缩性很强,容易获得,功能广泛,并且易于使用。
SQL Server的2008版本在数据挖掘方面有了令人兴奋的新改进,《数据挖掘原珲与应用(第2版)——SQL Server 2008数据库是SQL Server数据挖掘方面的经典之作,介绍了如何掌樨最新功能,是部署和使用SQL Server数据挖掘技术的实用指南。
数据挖掘原珲与应用(第2版)——SQL Server2008数据库》的作者团队首先介绍了使用SQLServer2008数据挖掘所需的工具、技术和概念,然后全面讨论了SQLServer2008数据挖掘算法的细节,以及如SQL Server数据挖掘技术与SQL Server Business Intelligence(BI)套件的其他部分集成起来,扩展SQL erver数据挖掘技术,以满足自己的需要。《数据挖掘原理与应用(第2版):SQL Server 2008数据库》中详尽而实用的示例清晰地解释了如何利用SQL Server2008年建成功的数据挖掘解决方案。使用Microsoft Excel实现数据挖掘解决方案使用Microsoft Office的数据挖掘插件理解应用SQL Server数据挖掘技术中的各种算法的方式、时间和场合在联机分析处理(OLAP)立方体中进行数据挖掘实现自己的数据挖掘算法和存储过程,以扩展SQL Server数据挖掘技术使用SQL Server Management Studio访问和保护数据挖掘对象使用SQL Server Business Intelligence Development Studio创建和管珲数据挖掘项目。

作者简介

作者:(美国)迈克伦南(Jamie MacLennan) (美国)唐朝晖(ZhaoHui Tang) (美国)克里沃茨(Bogdan Crivat) 译者:董艳 程文俊 合著者:杨大川

Jamie Mac Lennan,Microsoft公司SQL Server Analysis Services事业部的。位开发主管。他在SQL Server数据挖掘方面有超过25项专利,并且编写了大量关于SQL Server数据挖掘技术的著作。
唐朝晖(ZhaoHui Tang),Microsoft ad Center实验室的团队项目经理,Microsoft Keyword Services Platform的
发明人。
Bogdan Crivat,Microsoft公司SQL Server Analysis Services的资深软件设计工程师,主要研究方向是数据挖掘平台。
审校者简介:
杨大川,中国科学院软件学院兼职教授,毕业于美国纽约州立大学布法罗分校计算机系,曾担任美国硅谷Annuncio Software等公司的首席工程帅。归国后,2003年创办了北京迈思奇科技有限公司并担任技术总监,为国内外多家人中型企业提供商业智能咨询和项目实施服务,并逐渐从高新技术外包开发走向了自主知识产权产品的研发道路。曾荣获微软全球最有价值专家(MVP)称号,并于2008年荣获“中关村年度优秀创业留学人员”称号。

目录

第1章 SQLServer2008数据挖掘介绍
1.1 数据挖掘解决的商业问题
1.2 数据挖掘的任务
1.2.1 分类
1.2.2 聚类
1.2.3 关联
1.2.4.回归
1.2.5 预测
1.2.6 序列分析
1.2.7 偏差分析
1.3 数据挖掘项目的生命周期
1.3.1 商业问题的形成
1.3.2 数据收集
1.3.3 数据清理和转换
1.3.4 模型构建
1.3.5 模型评估
1.3.6 报告和预测
1.3.7 应用集成
1.3.8 模型管理
1.4 本章小结

第2章 用MicrosoftExcel2007进行数据挖掘
2.1 表分析工具的安装
2.1.1 配置具有管理权限的AnalysisServices
2.1.2 配置没有管理权限的AnalysisServices
2.1 3使用该插件的要求
2.1.4 寻求帮助
2.2 分析关键影响因素工具
2.2.1 主影响因素报表
2.2.2 区别报表
2.2.3 分析关键影响因素
任务小结
2.3检测类别工具
2.3.1 启动工具
2.3.2 类别报表
2.3.3 检测类别工具小结
2.4 从示例填充工具
2.4.1 运行工具,解释结果
2.4.2 细调结果
2.4 3从示例填充工具小结
2.5 预测工具
2.5.1 启动工具,指定选项
2.5.2 解释结果
2.5.3 预测工具小结
2.6 突出显示异常值工具
2.6.1 使用工具
2.6.2 更复杂的交互操作
2.6.3 限制和故障排除
2.6.4 突出显示异常值工具小结
2.7 应用场景分析工具
2.7.1 目标查找工具
2.7.2 对数字目标使用目标查找工具
2.7.3 对整个表使用目标查找工具
2.7.4 假设工具
2.7.5 对整个表使用假设工具
2.7.6 应用场景分析工具小结
2.8 预测计算器工具
2.8.1 运行工具
2.8.2 细调结果
2.8.3 使用结果
2.8.4 预测计算器工具小结
2.9 购物篮分析工具
2.9.1 使用工具
2.9.2 捆绑销售商品报表
2.9 3购物篮推荐报表
2.9.4 调整工具
2.9.5 购物篮分析工具小结
2.10 表分析工具的技术概述
2.11 本章小结

第3章 数据挖掘概念与DMX
3.1 DMX的发展历史
3.2 为什么使用DMX
3.3 数据挖掘过程
3.4 关键概念
3.4.1 属性
3.4.2 状态
3.4.3 事例
3.4.4 键
3.4.5 输入和输出
3.5 DMX对象
3.5.1 挖掘结构
3.5.2 挖掘模型
3.6 DMX查询语法
3.6.1 创建挖掘结构
3.6.2 创建挖掘模型
3.6.3 填充挖掘结构
3.7 预测
3.7.1 预测连接
3.7.2 预测查询语法
3.7.3 预测函数
3.7.4 嵌套表上的预测
3.7.5 预测嵌套值列
3.8 本章小结

第4章 使用SQLServer进行数据挖掘
4.1 BIDevStudio介绍
4.1.1 用户界面
4.1.2 脱机模式和即时模式
4.1 3创建数据挖掘对象
4.2 设置数据源
4.2.1 数据源
4.2.2 使用数据源视图
4.3 创建和编辑模型
4.3.1 结构和模型
4.3.2 使用数据挖掘向导
4.3.3 创建MovieClick挖掘结构和挖掘模型
4.3.4 使用数据挖掘设计器
4.4 处理
4.5 使用模型
4.5.1 了解模型查看器
4.5.2 使用挖掘准确性图表
4.5 3为MovieClick模型创建一个提升图
4.5.4 使用交叉验证
4.5.5 使用挖掘模型预测
4.5.6 针对MovieClick模型执行查询
4.5.7 创建数据挖掘报表
4.6 使用SQLServerManagementStudio
4.6.1 了解ManagementStudio用户界面
4.6.2 使用服务器资源管理器
4.6.3 使用对象资源管理器
4.6.4 使用查询编辑器
4.7 本章小结

第5章 使用Office2007执行数据挖掘过程
5.1 数据挖掘客户端简介
5.2 用数据挖掘客户端导入数据
5.3 数据浏览和准备
5.3.1 用浏览数据工具离散数据
5.3.2 砍掉长长的尾巴
5.3.3 合并多个含义
5.3.4 去除不合逻辑的值
5.3.5 配平数据
5.4 建模
5.4.1 基于任务的建模
5.4.2 数据挖掘客户端中的高级建模
5.5 准确性和验证
5.6 模型用法
5.6.1 浏览模型
5.6.2 用Visio查看模型
5.6.3 查询模型
5.6.4 查询向导
5.7 数据挖掘单元格函数
5.7.1 DMPREDICT函数
5.7.2 DMPREDICTTABLEROW函数
5.7.3 DMCONTENTQUERY函数
5.8 管理模型
5.9 跟踪
5.10 本章小结

第6章 Microsoft贝叶斯算法
6.1 贝叶斯算法介绍
6.2 使用贝叶斯算法
6.2.1 创建预测模型
6.2.2 数据浏览
6.2.3 关键影响因子的分析
6.2.4 文档分类
6.2.5 DMX
6.2.6 理解贝叶斯模型的内容
6.2.7 浏览贝叶斯模型
6.3 理解贝叶斯算法的基本原理
6.4 贝叶斯算法的参数
6.4.1 MAXIMUM_INPUT_ATTRIBUTES
6.4.2 MAXIMUM_OUTPUT_ATTRIBUTES
6.4.3 MAXIMUN_STATES
6.4.4 MINIUMUM-DEPENDENC_PROBABILITY
6.5 本章小结

第7章 Microsoft决策树算法
7.1 决策树算法介绍
7.2 使用决策树算法
7.2.1 创建决策树模型
7.2.2 DMX查询
7.2.3 模型内容
7.2.4 解释模型
7.3 决策树算法的基本原理
7.3.1 决策树生成的基本思想
7.3.2 处理变量中的多个状态
7.3.3 避免过度训练
7.3.4 结合先验知识
7.3.5 特征选择
7.3.6 使用连续的输入属性
73.7 回归
7.3.8 使用Microsoft决策树算法进行关联分析
7.4 算法参数
7.4.1 ComplexityPenalty
7.4.2 MmimumSuppot
7.4.3 Score-Method
7.4.4 SplitMethod
7.4.5 MaximumInputAttribute
7.4.6 MaximumOutputAtmbute
7.4.7 ForceRegressor
7.5 存储过程
7.6 本章小结

第8章 Microsoft时序算法:
8.1 Microsoft时序算法介绍
8.2 用法
8.3 DNⅨ
8.3.I模型的创建
8.3.2 模型的处理
8.3.3 预测
8.3.4 钻取功能
8.4 Microsoft时序算法的基本原理
8.4.1 自动回归
8.4.2 周期
8.4.3 自动回归树
8.4.4 预测
8.5 参数
8.5.1 MissingValueSutitution
8.5.2 PeriodicityHint
8.5.3 AutoDetectPeriodicity
8.5 4Minimum-Series-Value和Maximum-Series-Value
8.5.5 ForecastMethod
8.5.6 PredictionSmoothing
8.5.7 InstabilitySensitivity
8.5.8 Historic-Model-Count和HistoricModelGap
8.5.9 ComplexityPenalty和MinimumSupport
8.6 模型的内容
8.7 本章小结

第9章 Microsoft聚类算法
9.1 Microsoft聚类算法介绍
9.2 使用聚类模型
9.2.1 进行聚类
9.2.2 将聚类作为一个分析步骤
9.2 -3利用聚类检查异常
9.2.4 DN
9.2.5 模型内容
9.2.6 理解聚类模型
9.3 聚类算法的基本原理
9.3.1 硬聚类算法与软聚类算法
9.3.2 离散聚类
9.3.3 可伸缩聚类
9.3.4 聚类预测
9.4 聚类算法的参数
9.4.1 ClusteringMethod
9.4.2 Cluster-Count
9...4 3Minimum-Cluster-Cases
9.4.4 ModellingCardinality
9.4.5 StoppingTolerance
9.4 6Sample-Size
9.4.7 Cluster-Seed
9.4.8 MaximumInputAttributes
9.4.9 Maximum-States
9.5 本章小结

第10章 Microsoft序列聚类算法
10.1 Microsoft序列聚类算法介绍
10.2 使用Microsoft序列聚类算法
10.2.1 创建序列聚类模型
10.2.2 DMX查询
10.2.3 解释模型
10.3 Microsoft序列聚类算法的基本原理
10.3.1 什么是马尔可夫链
10.3.2 马尔可夫链的阶
10.3.3 状态转移矩阵
10.3.4 使用马尔可夫链来进行聚类
10.3.5 聚类分解
10.4 模型内容
10.5 序列聚类算法的参数
10.5.1 Cluster-Count
10.5.2 MinimumSupport
10.5.3 Maximum-States
10.5.4 MaximumSequence-States
10.6 本章小结
……
第11章 Microsoft关联规则算法
第12章 Microsoft神经网络算法和逻辑回归算法
第13章 挖掘OLAP立方体
第14章 SQLServer集成服务数据挖掘
第15章 SQLServer数控挖掘的体系结构
第16章 SQLServer数据挖掘编程
第17章 扩展SQLServer数据挖掘
第18章 实现Web交叉销售应用程序
第19章 总结与其他资源

序言

数据挖掘,作为商业智能(Business Intelligence)实现的最深层次,在商业智能解决方案的体系中占据着重要的位置。
数据库中存在的是数据,对于业务人员来说,只是一些无法看懂的天书,他们需要的是可以更容易理解的信息。那么,我们以前如何解决这个矛盾的呢?一般的答案是报表系统。简单地说,业务人员看到的是美观的界面,便捷的操作,鼠标点击后,报表系统生成SQL语句,数据库服务器收到以后,返回所需要的信息。不错,报表系统已经可以称作是BI了,它是BI的低端实现。
现在国外的企业,大部分已经进入了更深层次的商业智能,叫做数据分析,即基于多维数据库的在线分析系统(OLAP)。还有一些企业已经开始进入更深层次的商业智能,叫做数据挖掘。从广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,报表、多维分析和深度的挖掘都是挖掘数据的手段。但是,从技术术语上说,数据挖掘(Data Mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集,然后建立特定的挖掘模型,利用这些数据集训练模型,最后利用模型找出的知识模式进行预测,从而辅助决策工作。
过去,谈起数据挖掘,大家想到的往往是那些专业数学家、统计学家,一般的技术人员和业务人员望而却步。现在,随着IT技术的发展和工业化,SQL server2008提炼了上述的各种复杂知识,加工成友好的视窗工具,嵌入到分析服务(Aaaalysis Services)中,使得数据挖掘的用户扩展到了大量的开发者人群,甚至是经过培训的业务人员。它使我们的员工和程序变得更聪明了。
我在国外学习、工作了多年之后,深感商业智能即将成为未来几年IT领域的核心价值,因此从2003开始创建了北京迈思奇科技有限公司,致力于将国外的先进BI技术和工具引进国内,帮助国内的企业提高数据分析效率、增强竞争实力。公司成立六年来,与微软密切合作,通过数百次讲座和培训,为企业培养BI专业人员;同时,在承担BI项目开发的过程中,公司也积累了优秀的团队和丰富的项目案例,创立了国内一流的数据挖掘品牌。

文摘

插图:

喜欢数据挖掘原理与应用(第2版):SQL Server 2008数据库 [平装]请与您的朋友分享,由于版权原因,读书人网不提供图书下载服务

热点排行