java.util.Arrays的二分查找
今天程序中需要用到最快的查询算法,本来想自己写,可是突然感觉java提供强大的collection操作类库应该包含这些。于是搜了一番,发现,确实如我所想。自己写了个exaple:
但是java自带的jdk存在bug。如下是它的源码,1: public static int binarySearch(int[] a, int key) {2: int low = 0;3: int high = a.length - 1;4: 5: while (low <= high) {6: int mid = (low + high) / 2;7: int midVal = a[mid];8:9: if (midVal < key)10: low = mid + 1;11: else if (midVal > key)12: high = mid - 1;13: else14: return mid; // key found15: }16: return -(low + 1); // key not found.17: }
bug出现在第6行:
6: int mid =(low + high) / 2;
在一般情况下, 这个语句是不会出错的, 但是, 当low+high的值超过了最大的正int值 (231 - 1) 的时候, mid会变成负值, 这个时候, 会抛出ArrayIndexOutOfBoundsException 异常..
所以当一个数组包含超过2的30次方 个元素的时候, 就很可能会带来问题... 当然, 在一般的应用里面, 很少数组会包含那么多元素, 但是现在这样的情况已经越来越多了, 比如Google的海量运算..
那如何解决这个问题?
很简单, 修改这行语句为:
6: int mid = low + ((high - low) / 2);
或者
6: int mid = (low + high) >>> 1;
在c或者c++中, 则可以如下实现:
6: mid = ((unsigned) (low + high)) >> 1;