【算法】二分搜索

本文对二分搜索算法进行了详细地介绍，包括概述、代码实现和应用。

星许辰

4618人浏览 · 2023-01-07 20:29:55

星许辰 · 2023-01-07 20:29:55 发布

1.概述

（1）二分搜索 (Binary Search)，又称为折半搜索 (Half-interval Search)。它的前提是线性表中的记录必须是关键码有序（通常从小到大有序），线性表必须采用顺序存储。

（2）二分搜索的基本思想是：在有序表中，取中间记录作为比较对象，若给定值与中间记录的关键字相等，则查找成功;若给定值小于中间记录的关键字，则在中间记录的左半区继续查找;若给定值大于中间记录的关键字，则在中间记录的右半区继续查找。不断重复上述过程，直到查找成功，或所有查找区域无记录，查找失败为止。

（3）二分搜索的时间复杂度为 O(log₂n)。

2.代码实现

2.1.最基本的二分搜索

（1）最基本的二分搜索：给定一个 n 个元素有序的（升序）整型数组 nums 和一个目标值 target，搜索 nums 中的 target，如果目标值存在返回下标，否则返回 -1。实现代码如下：

class Solution {
    public int binarySearch(int[] nums, int target) {
        int left = 0;
        int right = nums.length - 1;
        while (left <= right) {
        	//防止整数溢出
            int mid = left + (right - left) / 2;
            if (nums[mid] == target) {
                return mid;
            } else if (nums[mid] < target) {
                left = mid + 1;
            } else if (nums[mid] > target) {
                right = mid - 1;
            }
        }
        return -1;
    }
}

该代码可以解决 LeetCode 中的704. 二分查找这题。

（2）大家肯定对上面的代码非常熟悉，不过这里需要其中的一些细节进行讨论：

① 在计算 mid 时，有以下两种方式：

int mid = (left + right) / 2;
int mid = left + (right - left) / 2;

这两种方法的计算结果相同，但需要注意的是：如果 left 和 right 的值非常大，那么 left + right 可能会出现整数溢出的情况，虽然该情况出现的概率比较低，但是从代码健壮性的角度来考虑，本文还是推荐使用第二种方式；

② while 循环条件写成 left <= right 和 left < right 的区别如下：

上述代码中的搜索区间为 [left, right]，注意区间的两边均为闭区间，而 while (left <= right) 的终止条件是 left == right + 1，此时的区间表示为 [right + 1, right]，这样的区间不存在，即此时的区间为空。所以此时 while 循环终止是正确的，直接返回 -1 即可。
while (left < right) 的终止条件是 left == right，此时的区间表示为 [right, right]（例如 right = 2，那么区间为 [2, 2]）此时区间非空，还有一个数 2，但此时 while 循环终止了，也就是说区间 [2, 2] 被漏掉了，索引为 2 的元素没有被搜索到，如果这时候直接返回 -1 就是错误的。
如果非要写成 while (left < right)，那么直接在返回语句处稍作修改即可：

//...
while(left < right) {
    // ...
}
return nums[left] == target ? left : -1;

③ 上述二分搜索代码的存在一定的局限性。例如，当 nums = {1, 4, 4, 4, 7}，target = 4 时，此时返回的索引为 2，这没有问题。但是如果想得到 target 的最左/右侧边界的索引时（即分别对应索引 1 和索引 3），则该算法无法直接满足该要求，只能继续向左/右进行线性搜索，但是这样就无法保证二分搜索的对数级的时间复杂度。因此下面将讨论搜索 target 的最左/右侧边界的索引的情况。

2.2.搜索最左侧边界

在这里插入图片描述

（1）实现代码如下：

public int searchLeftBound(int[] nums, int target) {
    int left = 0;
    int right = nums.length - 1;
    //当 left > right 即 left = right + 1 时结束循环
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] > target) {
            right = mid - 1;         
        } else if (nums[mid] == target) {
            right = mid - 1;
        }
    }
    /*
    	检查 left 越界的情况：
		当 target 比所有元素都大时，循环结束后 left = nums.length
	*/
    if (left >= nums.length || nums[left] != target) {
        return -1;
    }
    return left;
}

（2）下面对该代码中的一些细节进行讨论：

① 在 while 循环中，当 nums[mid] == target 时：

mid 未必就是 target 的最左侧边界索引（参考上面提到的例子），故不能直接返回 mid；
而由于我们想得到 target 的最左侧边界索引，且此时 nums[left…mid…right] 中的 nums[mid] 已经等于 target，那么接下来应该在 nums[left…mid - 1] 区间内进行搜索，所以要锁定左侧边界，并令 right = mid - 1；
如果此时的 mid 恰巧就是最左侧边界索引（记为 leftBound），那么此时 nums[left…mid - 1] 区间内的元素均小于 target，所以在后面的搜索中只有 left 会通过 left = mid + 1 被不断更新，而 right = leftBound - 1保持不变。又由于当 left > right，即 left = right + 1 时结束循环，所以最终 left = leftBound - 1 + 1 = leftBound；

② 当数组 nums 中不存在 target：

target 比所有元素都大时，循环结束后 left = nums.length；
其它情况下，直接判断 nums[left] 是否等于 target 即可；

③ 代码中的两个 else if 语句其实用一个 else 语句代替，这里写出来主要是为了方便理解，合并后的代码如下：

public int searchLeftBound(int[] nums, int target) {
    int left = 0;
    int right = nums.length - 1;
    //当 left > right 即 left = right + 1 时结束循环
	while (left <= right) {
		int mid = left + (right - left) / 2;
		if (nums[mid] < target) {
		    left = mid + 1;
		} else {
		    right = mid - 1;         
		}
	}
	if (left >= nums.length || nums[left] != target) {
        return -1;
    }
    return left;
}

2.3.搜索最右侧边界

在这里插入图片描述
（1）实现代码如下：

public int searchRightBound(int[] nums, int target) {
    int left = 0;
    int right = nums.length - 1;
    //当 left > right 时结束循环
    while (left <= right) {
        int mid = left + (right - left) / 2;
        if (nums[mid] > target) {
        	right = mid - 1;
        } else if (nums[mid] < target) {
            left = mid + 1;
        } else if (nums[mid] == target) {
            left = mid + 1;
        }
    }
    /*
    	检查 right 越界的情况：
		当 target 比所有元素都小时，循环结束后 right 会被减到 -1
	*/
    if (right < 0 || nums[right] != target) {
        return -1;
    }
    return right;
}

（2）下面对该代码中的一些细节进行讨论：

① 在 while 循环中，当 nums[mid] == target 时：

mid 未必就是 target 的最右侧边界索引（参考上面提到的例子），故不能直接返回 mid；
而由于我们想得到 target 的最右侧边界索引，且此时 nums[left…mid…right] 中的 nums[mid] 已经等于 target，那么接下来应该在 nums[mid + 1…right] 区间内进行搜索，所以要锁定右侧边界，并令 left = mid + 1；
如果此时的 mid 恰巧就是最右侧边界索引（记为 rightBound），那么此时 nums[mid + 1…right] 区间内的元素均大于 target，所以在后面的搜索中只有 right 会通过 right = mid - 1 被不断更新，而 left = rightBound + 1保持不变。又由于当 left > right，即 right = left - 1 时结束循环，所以最终 right = rightBound+ 1 - 1 = rightBound；

② 当数组 nums 中不存在 target：

target 比所有元素都小时，循环结束后 right = -1；
其它情况下，直接判断 nums[right] 是否等于 target 即可；

③ 代码中的两个 else if 语句其实用一个 else 语句代替，这里写出来主要是为了方便理解，合并后的代码如下：

public int searchRightBound(int[] nums, int target) {
    int left = 0;
    int right = nums.length - 1;
    //当 left > right 时结束循环
	while (left <= right) {
	    int mid = left + (right - left) / 2;
	    if (nums[mid] > target) {
	    	right = mid - 1; 
	    } else {
	        left = mid + 1;
	    }
	}
	if (right < 0 || nums[right] != target) {
        return -1;
    }
    return right;
}

注意：上面讨论的均是数组 nums 中的元素为升序的情况，如果为降序，那么只需相应改变 if 条件中的比较符号即可。

2.4.合并搜索最左/右侧边界

由于搜索最左侧边界和搜索最右侧边界的代码重复度很高，因此可以考虑将其合并，具体是实现代码如下所示：

class Solution {
	public int[] searchRange(int[] nums, int target) {
	    int leftIdx = binarySearch(nums, target, true);
	    int rightIdx = binarySearch(nums, target, false) - 1;
	    if (leftIdx <= rightIdx && rightIdx < nums.length && nums[leftIdx] == target && nums[rightIdx] == target) {
	        return new int[]{leftIdx, rightIdx};
	    } 
	    return new int[]{-1, -1};
	}	
	
	//如果 lower 为 true，则查找第一个大于等于 target 的下标，否则查找第一个大于 target 的下标
	public int binarySearch(int[] nums, int target, boolean lower) {
	    int left = 0, right = nums.length - 1, ans = nums.length;
	    while (left <= right) {
	        int mid = left + (right - left) / 2;
	        if (nums[mid] > target || (lower && nums[mid] >= target)) {
	            right = mid - 1;
	            ans = mid;
	        } else {
	            left = mid + 1;
	        }
	    }
	    return ans;
	}
}

2.5.递归版的二分搜索

（1）最基本的二分搜索

class Solution {
    public int binarySearch(int[] nums, int target) {
        return binarySearchRecursive(nums, target, 0, nums.length - 1);
    }
    
    private int binarySearchRecursive(int[] nums, int target, int left, int right) {
        if (left <= right) {
            int mid = left + (right - left) / 2;
            if (nums[mid] == target) {
                return mid;
            } else if (nums[mid] < target) {
                return binarySearchRecursive(nums, target, mid + 1, right);
            } else {
                return binarySearchRecursive(nums, target, left, mid - 1);
            }
        }
        return -1;
    }
}

（2）搜索最左侧边界

class Solution {
	public int searchLeftBound(int[] nums, int target) {
	    return binarySearchRecursive(nums, target, 0, nums.length - 1);
	}
	
	private int binarySearchRecursive(int[] nums, int target, int left, int right) {
	    if (left > right) {
	        return -1;
	    }
	    int mid = left + (right - left) / 2;
	    if (nums[mid] < target) {
	        return binarySearchRecursive(nums, target, mid + 1, right);
	    } else if (nums[mid] > target) {
	        return binarySearchRecursive(nums, target, left, mid - 1);
	    } else {
	        // 找到 target，继续向左边搜索
	        int result = binarySearchRecursive(nums, target, left, mid - 1);
	        if (result == -1) {
	            return mid;
	        } else {
	            return result;
	        }
	    }
	}
}

（3）搜索最右侧边界

class Solution {
	public int searchRightBound(int[] nums, int target) {
	    return binarySearchRecursive(nums, target, 0, nums.length - 1);
	}
	
	private int binarySearchRecursive(int[] nums, int target, int left, int right) {
	    if (left > right) {
	        return -1;
	    }
	    int mid = left + (right - left) / 2;
	    if (nums[mid] > target) {
	        return binarySearchRecursive(nums, target, left, mid - 1);
	    } else if (nums[mid] < target) {
	        return binarySearchRecursive(nums, target, mid + 1, right);
	    } else {
	        // 找到 target，继续向右边搜索
	        int result = binarySearchRecursive(nums, target, mid + 1, right);
	        if (result == -1) {
	            return mid;
	        } else {
	            return result;
	        }
	    }
	}
}

（4）由于搜索最左侧边界和搜索最右侧边界的代码重复度很高，因此可以考虑将其合并，并通过布尔类型的变量 isLeft 来决定来搜索的边界方向，下面的代码可以解决 LeetCode 中的 34.在排序数组中查找元素的第一个和最后一个位置这题。

class Solution {
	public int searchBoundRecursive(int[] nums, int target, int left, int right, boolean isLeft) {
        if (left > right) {
            return -1;
        }
        int mid = left + (right - left) / 2;
        if (nums[mid] == target) {
            if (isLeft) {
                if (mid == left || nums[mid - 1] != target) {
                    return mid;
                } else {
                    return searchBoundRecursive(nums, target, left, mid - 1, isLeft);
                }
            } else {
                if (mid == right || nums[mid + 1] != target) {
                    return mid;
                } else {
                    return searchBoundRecursive(nums, target, mid + 1, right, isLeft);
                }
            }
        } else if (nums[mid] > target) {
            return searchBoundRecursive(nums, target, left, mid - 1, isLeft);
        } else {
            return searchBoundRecursive(nums, target, mid + 1, right, isLeft);
        }
    }
}

3.应用

（1）可以使用二分搜索的关键在于：能够从问题中抽象出一个自变量 x，一个关于 x 的函数 f(x)，以及一个目标值 target，并且 f(x) 必须是在 x 定义域上的单调函数（也可看做有序的），并且题目是要求出 f(x) == target 时的 x 的值（或者 x 的最左/右侧边界值）。

（2）这里以最基本的二分搜索（即 LeetCode 中的704. 二分查找这题）为例，分别找出对应的 x、f(x) 和 target：

x	数组 nums 的下标，其范围（定义域）为 [0, nums.length - 1]
f(x)	f(x) = nums[x]，f(x) 是关于自变量 x 的函数，由于数组 nums 是有序的，所以 f(x) 在定义域上是单调的
target	题目中给的 target

（3）从最基本的二分搜索中抽象出 x、f(x) 和 target 较为简单，下面再来看 LeetCode 中的875. 爱吃香蕉的珂珂这题：

在这里插入图片描述

分析如下：

x	吃香蕉的速度，即题中的 k
f(x)	以速度 x 吃完香蕉所用的时间，并且它是单调递减的，即有序的（可以单独写一个函数来求解）
target	警卫离开后回来的时间，即题中的 H

此外，需要注意的是，本题是要求 x/k 的最小值，那么即对应搜索 f(x) = target 时 x 的最左侧边界，对应的如下图所示：

在这里插入图片描述

具体细节可以查看LeetCode_二分搜索_中等_875.爱吃香蕉的珂珂这篇文章，最终的实现代码如下：

//思路1————二分搜索
class Solution {
    public int minEatingSpeed(int[] piles, int h) {
        //maxK: 吃香蕉的最大速度
        int maxK = piles[0];
        for (int i = 1; i < piles.length; i++) {
            if (piles[i] > maxK) {
                maxK = piles[i];
            }
        }
        //吃香蕉的最小速度为 1 根/小时，最大速度为 maxK 根/小时
        int left = 1;
        int right = maxK;
        //查找左边界的二分搜索，计算吃完香蕉的最小速度
        while (left <= right) {
            int mid = left + (right - left) / 2;
            if (getTime(piles, mid) > h) {
                left = mid + 1;
            } else {
                right = mid - 1;
            }
        }
        //由于本题一定有解，故不需要做边界判断
        return left;
    }
    
    /*
    	实现 f(x)
        k:吃香蕉的速度（单位：根/小时）
        返回值:吃完所有香蕉所需的时间（单位：小时）
    */
    public long getTime(int[] piles, int k) {
        //防止整数溢出
        long hour = 0;
        for (int i = 0; i < piles.length; i++) {
            hour += piles[i] / k;
            if (piles[i] % k > 0) {
                hour++;
            }
        }
        return hour;
    }
}

（4）读到这里，想必大家对二分搜索有了一定的了解，大家可以去 LeetCode 上找相关的二分搜索的题目来练习，或者也可以直接查看LeetCode算法刷题目录 (Java)这篇文章中的二分搜索章节。如果大家发现文章中的错误之处，可在评论区中指出。

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

3D LUT图像处理

1. 介绍在我们开始之前，先对必要的背景知识做一些简单的铺垫。LUT 是 Lookup Table 的缩写，在图像处理方面，LUT 可以用来完成类似滤镜的效果，其原理本质上就是一个映射关系，输入颜色 (r, g, b)，通过 LUT 去查找，得到一个新的颜色 (R, G, B)，则完成了一次映射操作。LUT 又分为 1D LUT 和 3D LUT，1D LUT 是指 R, G, B 三个分量互相不