内容与标准为王:下一代互联网与下一代搜索
第一代互联网混淆了真正的数据和它的表现形式,第一代搜索无法区分关键词是出现在文章标题里还是正文里,无法区分“十面埋伏”是一个典故还是一部电影,因为第一代互联网上只有HTML字节流,再也没有其它的了
Blog的出现是第二代互联网的萌芽,它明确定义了数据的组成,并且是标准,Blog搜索完全可以区分标题和正文、作者、发表时间等,而不管它们在浏览器里的表现形式如何;其实目前各种搜索引擎提供的个性化搜索,如联邦快递的包裹运送进程等,都潜在的可进一步发展为标准,成为第二代互联网的内容组成;届时,医院间可共享格式完全相同的病历,网上书店也使用标准化的图书信息,这样,搜索将变得轻而易举,不必像今天这样,从成千上万的搜索结果中再进一步人工检视真正需要的信息