Hibernate 缓存剖析
引子:hibernate缓存分为一级缓存和二级缓存。从生命周期来分,可以称之为session级缓存和sessionFactory缓存。一级缓存是hibernate自带的,不可被卸载的。二级缓存要通过第三方组件来ehcache、oscache等手动配置。事实上session级缓存的存在时间是极短的,一般是没有意义的,除非你用了opensessioninview(见前文http://supben.iteye.com/blog/801308)。其实在hibernate3.x版本中,从使用的角度而言,二级缓存和一级缓存是一模一样的。所以不管你有没有使用二级缓存,以下讨论均成立。
类(class)缓存
首先要强调下,当你在任何地方缓存某个类的时候,应该考虑一下那个类的hashcode和equals方法是否需要重写,不然可能会确保不了key的唯一性。
第一次执行:iterate()依赖于缓存,所以第一次iterate()没意义。list()会直接发出sql , 并把结果存到缓存中。假设结果是三条记录,id分别是1,2,3。
第二次执行: 因为你没有配置查询缓存,list()仍然会直接发出sql去数据库中查找。而iterate()则会先发出一条sql取出id串。然后当你迭代的时候,他才会在缓存里根据id去查找结果。如果每条id都能取到值当然很和谐。但是如果缓存清了,或者结果集id串变了,假设成了4,5,6。那么他就会再发3条根据id查找对象实体的sql去数据库中查找。这就是经典的1+n问题。
于是答案似乎很显然:第一次用list,第二次用iterate方法就可以了。实则不然!因为你没法知道什么时候是第一次,什么时候是第二次? 我这里所谓的第一次,第二次是因为我测试的时候先用list方法去取出数据了,我知道缓存里有。但是在项目中你是不知道的。
综上:iterate虽然看起来很好,但是根本就没有使用价值!事实上,类缓存主要是给load和get方法来使用的,这时候根据id去查对象就只要从缓存中读就可以了,缓存中没有,大不了再发sql嘛。
小提示:hibernate 2.x中get是不走二级缓存的(这个设计的确是没什么必要!)。3.x 中get也会走二级缓存!(这就是引子中最后一段话的原因!)至于load和get方法的区别,那就是另外一个问题了,很简单,本文就不做讨论了。
查询(query)缓存
直接说查询缓存的特性和缺点
1.如果查询结果是当中的字段而不是整个对象。Hibernate会缓存整个结果集。这样会导致缓存大量的数据。占用大量的内存开销。
2.如果结果集是实体对象,此时只会缓存实体的id。他会依赖于类缓存。即,需要迭代的时候才会去类缓存中找。list方法此时就约等于iterate方法(后者是1+n问题,而前者是n问题…)。这也是为什么 iterate方法没有查询缓存的原因。
3.查询缓存的生命周期与session无关。当相关联的表数据做出任何修改时,查询缓存就会清空。所以查询缓存只适合在写操作极少的情况下使用。
4.多个程序访问一个数据库,或者是你用了非hibernate的方式,比如直接用jdbc修改了数据,查询缓存仍然不会清空。这就导致了脏数据!
综上: 对于多条记录来说list方法是唯一选择。如果没有以上所说的查询缓存的4点局限性,那么你可以配置查询缓存以提高list的效率。
另外如果设计到到分布部署,负载均衡之类的问题。Hibernate 二级缓存和查询缓存都不能开启!