首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 其他教程 > 开源软件 >

HBase数据查询之惯例查询

2014-05-11 
HBase数据查询之常规查询简述订单常规查询用到的字段可能有:店铺id、订单创建时间(不变量)、订单id、订单状态

HBase数据查询之常规查询
简述

订单常规查询用到的字段可能有:店铺id、订单创建时间(不变量)、订单id、订单状态等等。

如下设计适用场景:a.dp_id+created段查询(+状态或者其他filter条件)

                            b.tid查询

表设计

分两张表:

1.用于常规查询表,rowkey:dp_id+created+tid   cf:status:value  cf:buyer_nick:value...。查询条件的必须输入项有:created开始时间和结束时间。可有可无项:cf(列簇)中的字段,用于filter过滤。该表属于长表,字段数不多,占存储不大。

   当dp_id不均衡时,可使用hash(dp_id)%regions的方法解决rowkey:hash(dp_id)%regions+dp_id+created+tid。

   建议输入的created时间段不要跨度太大,防止hbase scan的数据太多而影响查询效率。

2.订单详情表,rowkey:tid反转  cf:data:...。反转的目的是均衡region。



其他

建议使用spring for hadoop框架,该框架管理了hbase client资源,很多操作可以省略。参见http://projects.spring.io/spring-hadoop/Spring for Apache Hadoop

热点排行