二分查找,要注意的地方--写一个正确的二分查找,并不简单

来源:互联网 发布:mac 桌面 窗口 关不掉 编辑:程序博客网 时间:2024/06/09 22:35

原文地址:http://www.cppblog.com/converse/archive/2009/09/21/96893.html


-----------------------------------

二分查找的思想,大家都知道,但是要写出完整的二分查找,还是有几点需要注意的。

在mid=(low+high)/2时,为了防止两个大数相加越界,我们可以使用 mid = low + (high-low)/2

同时要注意while的判断条件,下面是转载的别人的博客,说的挺好的,希望大家也二分查找的时候,也注意。 low 和high的值如何变化的, 是要+1 , -1,还是不要呢

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

我今早写下的错误代码类似于下面的样子:

[cpp] view plaincopy
  1. int search(int array[], int n, int v)  
  2. {  
  3.     int left, right, middle;  
  4.   
  5.     left = 0, right = n;  
  6.   
  7.     while (left < right)  
  8.     {  
  9.         middle = (left + right) / 2;  
  10.         if (array[middle] > v)  
  11.         {  
  12.             right = middle - 1;  
  13.         }  
  14.         else if (array[middle] < v)  
  15.         {  
  16.             left = middle + 1;  
  17.         }  
  18.         else  
  19.         {  
  20.             return middle;  
  21.         }  
  22.     }  
  23.   
  24.     return -1;  
  25. }  
  26.   
  27. int main()  
  28. {  
  29.     int array[] = {0, 1, 2, 3, 4, 5, 6, 7, 13, 19};  
  30.   
  31.     int m = search(array, sizeof(array)/sizeof(array[0]), 1);  
  32.   
  33.     printf("m = %d\n", m);  
  34.   
  35.     return 0;  
  36. }  

实际上,如果使用测试用例来测试,这个算法并不是在所有情况下都会出错的,还是有时可以得到正确的结果的.但是,你能看出来它错在哪儿吗?

在这里,循环的开始处,把循环遍历的序列区间是这样的:

left =0, right = n;
while (left < right)
{
    
// 循环体
}

也就是说,这是一个左闭右开的区间:[0, n).

但是,在循环内部, 却不是这样操作的:

[cpp] view plaincopy
  1. middle = (left + right) / 2;  
  2.   
  3.        if (array[middle] > v)  
  4.        {  
  5.            right = middle - 1;  
  6.        }  
  7.        else if (array[middle] < v)  
  8.        {  
  9.            left = middle + 1;  
  10.        }  
  11.        else  
  12.        {  
  13.            return middle;  
  14.        }  
当array[middle] > v条件满足时, 此时v如果存在的话必然在左闭右开区间[left, middle)中, 因此,当这个条件满足时, right应该为middle, 而在这里, right赋值为middle - 1了, 那么, 就有可能遗漏array[middle - 1] = v的情况.

因此,这种错误的写法并不是在所有的情况下都会出错,有时还是可以找到正确的结果的.

这是一种典型的二分查找算法写错的情况,循环体是左闭右开区间,而循环体内部却是采用左闭右闭区间的算法进行操作.
下面给出的两种正确的算法,算法search是左闭右闭区间算法,而算法search2是左闭右开区间算法,可以对比一下差异.
[cpp] view plaincopy
  1. int search(int array[], int n, int v)  
  2. {  
  3.     int left, right, middle;  
  4.   
  5.     left = 0, right = n - 1;  
  6.   
  7.     while (left <= right)  
  8.     {  
  9.         middle = (left + right) / 2;  
  10.         if (array[middle] > v)  
  11.         {  
  12.             right = middle - 1;  
  13.         }  
  14.         else if (array[middle] < v)  
  15.         {  
  16.             left = middle + 1;  
  17.         }  
  18.         else  
  19.         {  
  20.             return middle;  
  21.         }  
  22.     }  
  23.   
  24.     return -1;  
  25. }  
  26.   
  27. int search2(int array[], int n, int v)  
  28. {  
  29.     int left, right, middle;  
  30.   
  31.     left = 0, right = n;  
  32.   
  33.     while (left < right)  
  34.     {  
  35.         middle = (left + right) / 2;  
  36.   
  37.         if (array[middle] > v)  
  38.         {  
  39.             right = middle;  
  40.         }  
  41.         else if (array[middle] < v)  
  42.         {  
  43.             left = middle + 1;  
  44.         }  
  45.         else  
  46.         {  
  47.             return middle;  
  48.         }  
  49.     }  
  50.   
  51.     return -1;  
  52. }  

[cpp] view plaincopy
  1. 下面再给出另一种典型的错误的二分查找算法,当查找的元素不在序列内时,它可能造成程序的死循环.  
  2. int search(int array[], int n, int v)  
  3. {  
  4.     int left, right, middle;  
  5.   
  6.     left = 0, right = n - 1;  
  7.   
  8.     while (left <= right)  
  9.     {  
  10.         middle = (left + right) / 2;  
  11.         if (array[middle] > v)  
  12.         {  
  13.             right = middle;  
  14.         }  
  15.         else if (array[middle] < v)  
  16.         {  
  17.             left = middle;  
  18.         }  
  19.         else  
  20.         {  
  21.             return middle;  
  22.         }  
  23.     }  
  24.   
  25.     return -1;  
  26. }  

为什么会造成死循环?

从循环条件来看,这个算法的操作区间是左闭右闭区间的,因此当array[middle] > v时,v如果存在的话应该在[left, middle- 1]中,因此此时right应该是middle - 1,而不是middle;类似的,当array[middle] < v时,下一次操作的区间应该是[middle + 1, right]中.而当元素不存在这个序列中时,算法在一个错误的区间中循环,但是又不能终止循环,于是就造成了死循环.

因此,要将二分查找算法写对,其实很多人都大概知道思想,具体到编码的时候,就会被这些看似微小的地方搞糊涂.因此,需要注意这一点:
算法所操作的区间,是左闭右开区间,还是左闭右闭区间,这个区间,需要在循环初始化,循环体是否终止的判断中,以及每次修改left,right区间值这三个地方保持一致,否则就可能出错.
原创粉丝点击