基本信息·出版社:机械工业出版社 ·页码:243 页 ·出版日期:2009年02月 ·ISBN:7111261291/9787111261292 ·条形码:9787111261292 ·版本:第1版 · ...
商家名称 |
信用等级 |
购买信息 |
订购本书 |
|
|
移动搜索引擎原理与实践 |
|
|
|
移动搜索引擎原理与实践 |
|
基本信息·出版社:机械工业出版社
·页码:243 页
·出版日期:2009年02月
·ISBN:7111261291/9787111261292
·条形码:9787111261292
·版本:第1版
·装帧:平装
·开本:16
·正文语种:中文
·丛书名:信息科学与技术丛书·移动与嵌入式开发系列
·图书品牌:华章图书
内容简介 《移动搜索引擎原理与实践/移动与嵌入式开发系列》对从事移动搜索引擎研发所需技术进行了全面介绍,内容涵盖广泛,面向实战,将技术与市场紧密结合,对移动通信技术、搜索引擎技术、3G技术、WAP及短消息技术、数据挖掘技术、并行计算技术进行了详细的介绍。
《移动搜索引擎原理与实践/移动与嵌入式开发系列》可作为从事移动搜索技术研究、设计和开发的科技人员的重要参考书,也可作为从事移动搜索技术研究的学者及研究生的参考书籍。
编辑推荐 《移动搜索引擎原理与实践/移动与嵌入式开发系列》涵盖技术
移动通信技术
搜索引擎技术
数据挖掘技术
并行计算技术
目录 出版说明
前言
第1章 移动搜索引擎概述
1.1 引言
1.2 移动搜索引擎的特点
1.3 移动搜索引擎的分类
1.4 移动搜索引擎市场现状
1.5 移动搜索引擎的关键技术简介
1.6 移动搜索与3G
1.7 小结
第2章 移动通信技术概述
2.1 移动通信的分类
2.2 全球移动通信(GSM)网络
2.2.1 移动台(MS)
2.2.2 基站子系统(BSS)
2.2.3 网络子系统(NSS)
2.2.4 操作支持子系统(OSS)
2.2.5 移动搜索引擎与GSM网络
2.3 GSM的升级GPRS
2.3.1 GPRS的特点
2.3.2 GPRS的工作原理
2.3.3 GPRS的网络结构和网元功能
2.3.4 GPRS各个接口协议栈的功能
2.4 CDMA(CodeDivisionMultipleAccess)
2.4.1 CDMA技术的标准化
2.4.2 CDMA的优势
2.5 短信方式下的移动搜索引擎协议
2.5.1 SMS(ShortMessagingService)
2.5.2 EMS(EnhancedMessagingService)
2.5.3 MMS(MultimediaMessageService)
2.5.4 SMS、EMS、MMS三者技术对比
2.6 WAP
2.6.1 WAP的特点
2.6.2 WAP的优势及局限性
2.6.3 WAP的发展前景
2.7 CMWAP和CMNET
2.7.1 CMWAP与CMNET的区别
2.7.2 CMWAP与CMNET服务适用范围
2.8 小结
第3章 网页抓取技术
3.1 基于WAP的搜索引擎系统结构
3.2 WAP爬虫基本原理
3.2.1 网页抓取
3.2.2 内容提取
3.2.3 爬虫的难题
3.2.4 爬虫更新周期
3.3 WAP爬虫的关键技术
3.3.1 从种子站点开始逐层抓取(逐层抓取策略)
3.3.2 不重复抓取策略
3.3.3 网页抓取优先策略
3.3.4 网页重访策略
3.3.5 Robots协议
3.3.6 抓取提速策略
3.4 构建垂直搜索引擎
3.4.1 小天音乐垂直搜索引擎整体处理流程
3.4.2 小天音乐垂直搜索引擎服务器部分源代码
3.5 小结
第4章 网页信息预处理
4.1 结构化的数据和半结构化的数据
4.1.1 XML——最常见的结构化数据
4.1.2 半结构化的数据
4.2 网页信息结构化
4.2.1 网页信息结构化的基本流程
4.2.2 建立DOM树的原理
4.2.3 移动网页的信息结构化
4.3 中文分词
4.3.1 中文分词的概念
4.3.2 中文分词的难点
4.3.3 基于字典的分词方法
4.3.4 用统计学的方法解决新词识别问题
4.3.5 主流中文搜索引擎分词效果比较
4.3.6 典型的中文分词系统
4.4 小结
第5章 建立索引和实现查询
5.1 搜索引擎中的索引简介
5.1.1 基于索引的搜索引擎分类
5.1.2 索引器在搜索引擎中的作用
5.2 建立索引
5.2.1 倒排文件索引(InvertedFileIndex)的建立
5.2.2 后缀数组
5.2.3 签名文件索引(SigamtureFileIndex)
5.3 查询服务
5.3.1 查询器的实现原理
5.3.2 查询器的分页机制
5.3.3 查询扩展与结果集的动态分类
5.4 查询结果排序
5.4.1 PageRaNk算法
5.4.2 HillT0p算法
5.4.3 提升网页排序的方法
5.5 索引设计的典型案例
5.6 小结
第6章 WML转换
6.1 标记语言简介
6.1.1 HTML
6.1.2 XML
6.1 -3XHTML
6.1.4 WML
6.2 WAJP体系与结构
6.2.1 WAP体系结构
6.2.2 万维网模型
6.2.3 WAP模型
6.3 HTML到WML的转换
6.3.1 标记语言转换概述
6.3.2 HTML与WML的主要语法标记
6.3.3 HTML与WMHL的文档结构对比
6.3.4 HTML与WML的转换
6.3.5 正则表达式和Java开源项目
6.4 衡量搜索引擎性能
6.4.1 衡量搜索引擎的性能指标
6.4.2 搜索引擎的评价方式
6.5 小结
第7章 基于短信的移动搜索引擎
7.1 概述
7.2 互联网和短信并存的效应
7.3 短信平台
7.4 短信接入
7.4.1 协议规范
7.4.2 协议流程
7.4.3 接口更改
7.4.4 接口开发
7.5 短信搜索的功能设计
7.5.1 功能组织结构
7.5.2 短信监控功能设计
7.5.3 短信监控的数据库设计
7.5.4 分发平台功能设计
7.5.5 处理模块功能设计
7.6 小结
第8章 并行技术在移动搜索中的应用
8.1 并行计算
8.1.1 并行计算的概念
8.1.2 并行计算的发展
8.2 MPI简述
8.2.1 MPI的产生
8.2.2 MPI的语言绑定
8.2.3 目前主要的MPI实现
8.2.4 MPI程序结构
8.3 并行计算技术在移动搜索引擎中的应用
8.4 并行计算技术在索引/排序部分的应用
8.5 并行计算技术在移动搜索部分的应用
……
第9章 3G时代的移动搜索引擎展望
第10章 数据挖掘技术在移动搜索引擎中的应用
参考文献
……
序言 随着信息科学与技术的迅速发展,人类每时每刻都会面对层出不穷的新技术、新概念。毫无疑问,在节奏越来越快的工作和生活中,人们需要通过阅读和学习大量信息丰富、具备实践指导意义的图书,来获取新知识和新技能,从而不断提高自身素质,紧跟信息化时代发展的步伐。
众所周知,在计算机硬件方面,高性价比的解决方案和新技术的应用一直备受青睐;在软件技术方面,随着计算机软件的规模和复杂性与日俱增,软件技术受到不断挑战,人们一直在为寻求更先进的软件技术而奋斗不止。目前,计算机在社会生活中日益普及,随着因特网延伸到人类世界的层层面面,掌握计算机网络技术和理论已成为大众的文化需求。由于信息科学与技术在电工、电子、通信、工业控制、智能建筑、工业产品设计与制造等专业领域中已经得到充分、广泛的应用,所以这些专业领域中的研究人员和工程技术人员越来越迫切需要汲取自身领域信息化所带来的新理念和新方法。
a
针对人们对了解和掌握新知识、新技能的热切期待,以及由此促成的人们对语言简洁、内容充实、融合实践经验的图书迫切需要的现状,机械工业出版社适时推出了“信息科学与技术丛书”。这套丛书涉及计算机软件、硬件、网络、工程应用等内容,注重理论与实践相结合,内容实用,层次分明,语言流畅,是信息科学与技术领域专业人员不可或缺的图书。
现今,信息科学与技术的发展可谓一日千里,机械工业出版社欢迎从事信息技术方面工作的科研人员、工程技术人员积极参与我们的工作,为推进我国的信息化建设作出贡献。
文摘 第1章 移动搜索引擎概述
1.1 引言
移动搜索是指用户在移动通信网络中,通过移动终端,利用SMS、WAP、IVR等多种特定搜索方式获取所需信息的搜索行为。移动搜索服务的核心是将搜索引擎与移动设备有机结合,生成符合移动产品和用户特点的搜索结果,从而脱离对固定设备和固定通信网的依赖,实现随时随地的信息获取。手机移动搜索作为搜索技术与移动通信技术的一种结合体,融合了两种技术的特点。移动搜索是网络搜索引擎在移动终端的延伸,是未来搜索引擎发展的一个重要趋势。尽管面临着诸多问题,但移动搜索的崛起已成为大势所趋。伴随着3G商用的来临,移动搜索必将逐步迈进高速发展的快车道。
1.从有线到无线
1994年大家熟知的Lycos成为第一个现代意义的搜索引擎,1998年Google正式推出,成为全球最受欢迎的搜索引擎。我国的搜索引擎从北大天网开始逐步发展,到2000年出现“百度”搜索引擎,有线互联网搜索引擎已形成从中文到英文信息的全覆盖。
在有线互联网快速发展的同时,无线通信技术也以更快的速度在发展,手机已成为人们必不可少的沟通工具,搜索引擎的战火已从互联网烧到了无线通信网。2004年我国开始出现移动搜索引擎,随后Google、“百度”相继推出了自己的移动搜索引擎。由于人们生活节奏的加快,传统的信息搜索方式已无法满足快节奏的生活和工作方式,无线搜索引擎必将会有广阔的市场空间。