阅读提示:内容比较多,核心思想帮大家归纳一下。如果没有时间看,建议把后面的问题做一下。
题解核心内容:所有模板都一样,不可以套模板,而应该
仔细看题(解题的关键在认真读题)
,分析清楚题目要找的答案需要满足什么性质。采用两边夹的方式,每一轮把待搜索区间分成两个部分,排除掉一定不是答案的区间,最后左右指针重合的地方就是我们要找的元素。
说明
:我所有的关于「二分查找」法的题解,都会明确地标注「下一轮搜索区间是什么」,进而设置左边界 left
和 右边界 right
。在我写的「二分查找」题解里,while(left < right)
不表示
循环不变量的区间定义是 [left..right)
,也就是说,如果我分析出,下一轮搜索区间是 [mid..10]
,我会设置 right = 10
,而不会设置 right = 11
。
如果你看我写的「二分查找」题解,请忘记掉「左闭右开」这件事情,它会对你有所干扰。
二分查找只有一个思想,那就是:逐步缩小搜索区间
。
本题解向大家介绍的,使用
left
和right
向中间靠拢的方法,有一个非常强的语义,那就是:当
left与
right重合的时候,我们就找到了问题的答案
,使用这种写法有一个巨大的好处,那就是返回值不需要考虑返回left
还是right
,因为退出循环以后,它们是重合的。
在做题的过程中,会遇到两个难点:1、取
mid
的时候,有些时候需要+1
,这是因为需要避免死循环;2、只把区间分成两个部分,这是因为:只有这样,退出循环的时候才有left
与right
重合,我们才敢说,找到了问题的答案。(这两个难点,在练习的过程中,会逐渐清晰,不用着急一下子搞懂,事实上并不难理解)。
第一部分:本题题解
这一部分一定要分析清楚:
- 题目要找的元素是:第一个大于等于
target
的元素的下标; - 数组的长度
len
也有可能是问题的答案,「参考代码 2」设置right = len
不是因为设置区间是「左闭右开」,而是因为len
本来就有可能是问题的答案。
上面 2 个小点,都需要仔细分析题意和几个示例得到,任何模板都不能回答这样的问题。
题意分析
根据示例,分析题目要我们返回的「插入元素的位置」是什么。
思路分析
在有序数组中查找,可以使用「二分查找」。
根据「题意分析」中对示例的描述:
- 情况 1:
如果当前
mid看到的数值严格小于
target,那么
mid以及
mid左边的所有元素就一定不是「插入元素的位置」
,因此下一轮搜索区间是[mid + 1..right]
,下一轮把left
移动到mid + 1
位置,因此设置left = mid + 1
; - 情况 2:否则,如果
mid
看到的数值大于等于target
,那么mid
可能是「插入元素的位置」
,mid
的右边一定不存在「插入元素的位置」。如果mid
的左边不存在「插入元素的位置」,我们才可以说mid
是「插入元素的位置」。因此下一轮搜索区间是[left..mid]
,下一轮把right
移动到mid
位置,因此设置right = mid
。
说明
:上面的两点中,「情况 2」其实不用分析得那么细致, 因为只要「情况 1」的区间分析是正确的,「情况 2」一定是「情况 1」得到的区间的反面区间。
参考代码 1
:
- Java
|
|
说明
:while (left < right)
表示当 left
与 right
重合的时候,搜索终止。根据题意和示例
,区间 nums[left..right]
里一定存在「插入元素的位置」,且 while
循环里只把区间分成两个部分,退出循环的时候一定有 left == right
成立,因此返回 left
或者 right
都可以。
复杂度分析
:
- 时间复杂度:O(logN)O(\log N)O(logN),这里 NNN 是输入数组的长度;
- 空间复杂度:O(1)O(1)O(1)。
既然 len
也有可能是答案,可以在初始化的时候,把 right
设置成 len
,在一开始的时候就不需要特殊判断了。
参考代码 2
:
- Java
|
|
复杂度分析
:(同参考代码 1)
第二部分:二分查找常见问题回答
温馨提示
:
- 以下内容有点多,但是都是非常简单直观的内容。我整理了在我的题解下网友的诸多疑问,进行了总结,希望大家能认真看看;
- 真的踏踏实实做完一些二分查找的问题,已经有了足够的思考,就会觉得没有那么难。
问题 1
:为什么在你的题解里 while (left < right)
表示左闭右闭区间
回答
:看到 while (left < right)
不表示搜索区间为「左闭右开」,这一点没有根据。真正应该看边界如何设置
,这一点完全是人为定义。
表示一个区间,最直接的表示就是左闭右闭区间。例如:我们想表示搜索的范围是
|
|
,很自然地会表示成 [1..9]
,我们也会说这些数是 1
到 9
之间的数,包括 1
和 9
。正常情况下,不会说:这些数在 1
到 10
之间,不包括 10
;
只看到 while (left < right)
里的 <
,不能说明右边界不能取到。真正看区间表示应该看左右边界到底如何设置,如果我们分析出下一轮搜索的范围是 [left..mid]
而设置 right = mid + 1
,才表示搜索区间为「左闭右开」区间 。这是因为
|
|
可以看到,任何一个「左闭右开」区间都对应一个「左闭右闭」区间。我们已经可以确切地知道要搜索的数的右边界是什么, 没有必要把右边界再 +1+1+1。
重点
:真正写对「二分查找」,从来不在于我们把区间写成了「左闭右开」还是「左闭右闭」,而是 在于我们能够根据题意:得到某种单调性,和可以逐步缩小搜索规模的条件,进而准确地设计可以使得搜索区间缩小的条件
。
问题 2
:二分查找是不是要求数组一定是有序的?
回答
:不一定。
「力扣」上有一些问题输入数组不是有序的,例如「旋转有序数组」「山脉数组」(题号在第三部分的习题列表里),这些问题题目给出的是「接近有序」的数组,依然可以使用「二分查找」,这是因为这些数组都有规律可循,可以根据看到的 num[mid]
的值,推测两侧元素的性质,进而 缩小搜索区间
。
还有一类问题,例如「力扣」第 287 题,这一类题目不是在输入数组上做二分
,而是在输入数组的最小值 min
和最大值 max
组成的连续整数数组上查找一个数,即搜索区间是 [min..max]
,这个区间是单调的。
这一类问题的特点是:题目要我们找一个整数,这个整数的范围是确定的,可以使用「二分查找」,这样的问题叫「二分答案」。很多引入「二分查找」的例子,其实就是在做「二分答案」,《幸运 52》猜价格游戏,就是在用「二分查找」的思想猜到商品准确的价格。
问题 3
:为什么有一些二分查找取 mid
的时候,括号里要加 1?
这是因为
|
|
在区间里有偶数个元素的时候,mid
只能取到位于左边的中间数,要想取到位于右边的中间数,就需要在括号里加 1。
为什么要取右边中间数呢?这是因为在区间里 只有 222 个元素的时候
,把 [left..right]
划分成 [left..mid - 1]
和 [mid..right]
这两个区间,
|
|
这种取法不能把搜索区间缩小。
理解这件事情最典型的例子是「力扣」第 69 题,详细的分析和调试在 这里。
总之就是为了:避免死循环
。
问题 4
:能不能解释一下其它「二分查找」的模板为什么是对的?
这个问题我已经回答在 题目求助|二分查找不同实现方法细节困惑。我再补充一下:不管是哪一种模板,都不会回答看到的 mid
的值以后如何设计条件,把区间进行正确的划分,以及:
- 在某种条件下,
mid
的值是否可以取到; - 下一轮搜索是在
mid
的左边还是右边继续查找。
「模板一」告诉你全部把 mid
排除掉,用 ans
做补救,保证不会错过答案,「模板三」告诉你全部把 mid
保留,退出循环以后 [left..right]
里剩下两个数,再单独判断一下。它们有「限制死的地方」,所以一定要再理解清楚题意的情况下,正确使用。这些模板没有好坏和优劣之分,它们背后解决问题的思想是一样的。
再次强调一下:我们学习算法不是背了一个模板然后往里面填空,而是我们真的清楚写的代码每一步在做什么,每一步搜索的范围是什么。更不是因为把区间表示成「左闭右开」而使得问题变得简单。
问题 5
:什么时候 right
取 len
?什么时候 right = len - 1
?
回答
:这种问题就像你问我什么时候向左边找,什么时候向右边找,我的回答都是:看题目,每个问题的答案都未必一样
。
先回答什么时候 right
取 len
?什么时候 right = len - 1
?就像本题(「力扣」第 35 题),「示例 3」就告诉我们,len
是有可能成为答案的,所以设置 right = len
,上面第一部分「参考代码 2」的写法,「参考代码 1」已经做了一次判断,在 len
不可能是答案的情况下,才设置 right = len - 1
。这一点请不要扯上区间「左闭右开」和「左闭右闭」了,毫无关系。
「力扣」第 34 题,查找 target
在有序数组出现的第一次的位置和最后一次出现的位置,既然是数组里的位置,最小是 0
,最大是 len - 1
。
用这两个例子还是想说:到底设置的搜索区间是什么,看题目怎么说。
再回答什么时候向左边找,什么时候向右边找。回答还是 看题目
:输入数组是升序还是降序,决定了向左边找还是向右边找。
总结
:如果不能够正确理解题意,不去真正仔细的做练习、分析和总结,凭空想到底这些问题改怎么做,抱怨「二分查找」细节多、难是没有用的。其实根本没有想象中的难。用最直接、简单的想法看待「二分查找」就可以。
下面再为大家总结一下「二分查找」的重点。
二分查找重点概括
- 写成
while(left < right)
,退出循环的时候有left == right
成立,好处是:不用判断应该返回left
还是right
; - 区间
[left..right]
划分只有以下两种情况:分成
[left..mid]
和[mid + 1..right]
,分别对应right = mid
和left = mid + 1
;分成
[left..mid - 1]
和[mid..right]
,分别对应right = mid - 1
和left = mid
,这种情况下。需要将1
int mid = (left + right) / 2
改成
1
int mid = (left + right + 1) / 2
,否则会出现死循环,
这一点不用记,出现死循环的时候,把
left和
right的值打印出来看一下就很清楚了
;
- 退出循环
left == right
,如果可以确定区间[left..right]
一定有解,直接返回left
就可以,否则还需要对
left这个位置单独做一次判断
; - 始终保持不变的是:在区间
[left..right]
里查找目标元素。
关于如何写对二分查找,二分查找的详细讲解,可以查看我编写的 LeetBook 的「二分查找」 章节。
第三部分:二分查找题解列表(包含文字题解和视频题解)
以下是练习(我写过很多「二分查找习题列表」,我暂时先把它们汇总在这里)。
提示
:这些问题都不应该套模板去做,而应该在真正弄清楚题意(明确地知道题目要我们找的元素的性质)以后,对看到的元素进行合理的分支判断,进而清楚搜索的范围。
二分查找的基本思想是「减而治之」,即逐渐缩小问题规模。以下的二分查找问题,我们都不应该背下来,而应该在练习的过程中逐渐掌握分析问题、解决问题的方法。
可以采用的循环不变量是:总是在区间 [left..right]
里查找目标元素。采用左闭右开区间只会增加麻烦。
遇到问题的时候,一定需要仔细调试,使用最最基本的打印输出语句,针对错误测试用例,发现出错的原因。
题型一:二分求下标(在数组中查找符合条件的元素的下标)
说明
:
第 704 题:二分查找的最原始问题,使用两边夹的二分查找方法需要后处理(退出循环以后,还需要判断
left
或right
位置的值是不是问题的答案);第 34 题、第 35 题:需要明白这一类问题的共同特点,请见 这里;
第 300 题:特别经典的一道「动态规划」,二分查找的思路基于「动态规划」的状态定义得到,代码很像第 35 题;
第 658 题:这个问题二分的写法需要做复杂的分类讨论,可以放在以后做;
第 4 题:二分查找里最难的问题,重点在于理解:① 为什么是在短数组里找边界;② 深刻理解搜索边界的意义。
题号 | 链接 | 题解 |
---|---|---|
704 | 二分查找(简单) | |
35 | 搜索插入位置(简单) | 【视频讲解】、文字题解 |
300 | 最长上升子序列(中等) | 文字题解 |
34 | 在排序数组中查找元素的第一个和最后一个位置(简单) | 【视频讲解】、文字题解 |
611 | 有效三角形的个数 | 文字题解 |
658 | 找到 K 个最接近的元素(中等) | 文字题解 |
436 | 寻找右区间(中等) | 文字题解 |
1237 | 找出给定方程的正整数解(中等) | |
1300 | 转变数组后最接近目标值的数组和(中等) | 文字题解 |
4 | 寻找两个有序数组的中位数(困难) | 【视频讲解】、文字题解 |
使用二分查找的前提不一定非要是「有序数组」。旋转有序数组(下表前 4 题)、山脉数组(下表后 2 题)里的查找问题也可以使用「二分查找」。这些问题的解决思路是:利用 局部单调性
,逐步缩小搜索区间。
题号 | 链接 | 题解 |
---|---|---|
33 | 搜索旋转排序数组(中等) | 文字题解 |
81 | 搜索旋转排序数组 II(中等) | 文字题解 |
153 | 寻找旋转排序数组中的最小值(中等) | 文字题解 |
154 | 寻找旋转排序数组中的最小值 II(困难) | 文字题解 |
852 | 山脉数组的峰顶索引(简单) | |
1095 | 山脉数组中查找目标值(中等) | 【视频讲解】、文字题解 |
题型二:二分答案(在一个有范围的区间里搜索一个整数)
如果题目要我们找一个整数,这个整数有确定的范围,可以通过二分查找逐渐缩小范围,最后逼近到一个数。
定位一个有范围的整数,这件事情也叫「二分答案」或者叫「二分结果」。如果题目要求的是一个整数,这个整数有明确的范围,可以考虑使用二分查找。
事实上,二分答案是我们最早接触的二分查找的场景。「幸运 52」里猜价格游戏,就是「二分查找」算法的典型应用:先随便猜一个数,如果猜中,游戏结束。如果猜大了,往小猜;如果猜小了,往大猜。
说明
:
- 第 69 题:在一个整数范围里查找一个整数,也是二分查找法的应用场景;
- 第 275 题:这个问题题解题意得花很多时间,可以跳过不做;
- 第 278 题:在一个整数范围里查找一个整数,
不是在输入数组里使用二分查找
。这个问题二分查找的解法很反常规(不应该用时间换空间),知道即可。
题号 | 链接 | 题解 |
---|---|---|
69 | x 的平方根(简单) | 文字题解 |
287 | 寻找重复数(中等) | 文字题解 |
374 | 猜数字大小(简单) | 文字题解 |
275 | H指数 II(中等) | 文字题解 |
1283 | 使结果不超过阈值的最小除数(中等) | 文字题解 |
1292 | 元素和小于等于阈值的正方形的最大边长(中等) |
题型三:二分答案的升级版(每一次缩小区间的时候都需要遍历数组)
说明
:这一类问题本质上还是「题型二」(二分答案),但是初学的时候会觉得有一些绕。这一类问题的问法都差不多,关键字是「连续」、「正整数」
,请大家注意捕捉题目中这样的关键信息。
这里给出的问题解法都一样,会一题等于会其它题。问题的场景会告诉我们:目标变量和另一个变量有相关关系(一般是线性关系),目标变量的性质不好推测,但是另一个变量的性质相对容易推测(满足某种意义上的单调性)
。这样的问题的判别函数通常会写成一个函数的形式。
这一类问题可以统称为「 最大值极小化
」问题,最原始的问题场景是木棍切割问题,这道题的原始问题是「力扣」第 410 题(分割数组的最大值(困难))。
思路是这样的:
- 分析出题目要我们找一个整数,这个整数有范围,所以可以用二分查找;
- 分析出
单调性
,一般来说是一个变量a
的值大了,另一个变量b
的值就变小,而「另一个变量的值」b
有限制,因此可以通过调整a
的值达到控制b
的效果; - 这一类问题的题目条件一定会给出
连续
、正整数
这样的关键字。如果没有,问题场景也一定蕴含了这两个关键信息。
参考资料:
- 二分查找之「最大值极小化」相关问题及解题步骤
- 二分查找之「最大值极小化」例题选讲
以下给出的问题无一例外。
题号 | 链接 | 题解 |
---|---|---|
875 | 爱吃香蕉的珂珂(中等) | 文字题解 |
410 | 分割数组的最大值(困难) | 文字题解 |
LCP 12 | 小张刷题计划(中等) | 题解在第 410 题题解里 |
1011 | 在 D 天内送达包裹的能力(中等) | |
1482 | 制作 m 束花所需的最少天数(中等) | 题解在第 1300 题题解里 |
1552 | 两球之间的磁力(中等) |
补充:「力扣」第 209 题:长度最小的子数组(中等),这道题可以使用「前缀和 + 二分查找」或者「滑动窗口」来做,一定要想清楚,为什么可以使用这些方法。