首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 图书频道 > 计算机与网络 > 程序设计 >

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

2017-08-01 
本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。这一部分内容涉
商家名称 信用等级 购买信息 订购本书
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 去商家看看
基于R语言的自动数据收集:网络抓取和文本挖掘实用指南 去商家看看

基于R语言的自动数据收集:网络抓取和文本挖掘实用指南

本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。这一部分内容涉及互联网上通信、交换、保存和显示信息的基础技术(如HTTP、HTML、XML、JSON、AJAX、SQL等),并讲解用于查询网络文档和数据集的基本技术(XPath和正则表达式)。第9~11章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。这些案例分析针对日常的数据抓取和文本处理的工作流程、真实环境数据中的陷阱以及规避它们的方法等问题提供一些实用的见解。

网友对基于R语言的自动数据收集:网络抓取和文本挖掘实用指南的评论

这是一本非常贴近实战的书。作者所有的介绍都是围绕如何用R进行数据抓取展开,涵盖了XML/JSON, HTTP, Web Service API, SQL 等基础知识。作为一个非专业开发人员,我能够跟随作者的介绍一点点理解用R进行数据抓取的步骤,并写一些简单的抓取脚本解决我遇到的问题。正像作者所说的,读这本书之前最好具备一点R的基础知识。如果没有这方面的储备其实也不要紧,把作者给出的例子操作一遍,遇到问题的时候去网上搜索一些相关知识,还是可以顺利把这本书读完的。

可以看得出,翻译者是非常认真地在翻译,文字严谨,条理清晰,真是一本不可多得的好书。

里面讲到了很多R语言文本分析要用到的 背景知识 还有作者自己做的案例 丰富的内容严谨的叙述 我喜欢这本书

用R进行网络数据的分析和文本挖掘的经典

喜欢基于R语言的自动数据收集:网络抓取和文本挖掘实用指南请与您的朋友分享,由于版权原因,读书人网不提供图书下载服务

热点排行