人工智能问题通常是在某个可能的解答空间中寻找一个解的求解过程。
搜索:根据问题实际情况,不断寻找可利用的知识(或条件),构造一条代价最小的推理路线,寻求问题解决的过程
搜索技术的关键:2W
搜索两个方面:
许多搜索问题都可以转化为图搜索问题
搜索类型:
存在问题:深度问题、死循环问题
解决方法:对搜索深度加以限制、记录从初始状态到当前状态的路径
搜索算法的通常类型
图搜索包括穷举搜索和启发式搜索
状态空间法:利用状态变量和操作符好表示系统或问题的有关知识的符号体系
状态空间用四元组表示:(S,O,S0,G)(S,O,S_0,G)(S,O,S0,G)(分别为状态集合、操作算子集合、初始状态集合、目标状态集合)(S0⊂SS_0\subset SS0⊂S,G⊂SG\subset SG⊂S)
状态空间图:状态=节点,边=状态之间的关系(操作算子)
图搜索策略:初始节点出发、按照问题的约束条件寻找到达目标点(状态)路径的方法
路径:一个状态序列(初始状态→目标状态)
一般是便搜索边生产图
搜索问题的描述:
搜索树:
搜索空间:一系列状态的汇集
搜索算法的评价指标:
时间/空间复杂度的确定:
特点:没有利用任何与问题有关的知识或信息
基本思想:优先扩展深度最深的节点
从根节点开始,在回溯之前沿每个分支搜索至深度界限
是深度优先搜索的一种,核心思想是:发现原先选择并不优或达不到目标,就退回一步重新选择,“走不通就退回再走”
深度优先搜索和回溯法的主要区别是:
深度优先搜索的特点:
基本思想:优先扩展同级直接相连的节点
以接近起始节点的程度依次扩展节点、逐层搜索:从根节点开始,在移动到下一个深度级别的节点之前,探索当前深度的所有邻居节点
广度优先搜索的特点:
深度优先搜索与广度优先搜索比较:
算法 | 深度优先搜索(DFS) | 广度优先搜索(BFS) |
---|---|---|
完备性 | 不一定(若解不在某个分支,而这个分支又是无穷分支,那就永远出不来了) | 完备(在分支因子bbb优有限的情况下) |
最优性 | 不具备 | 最优(如果路径代价是节点深度的非递减函数) 不一定最优(通常情况下) |
时间复杂度 | O(bm)O(b^m)O(bm) | O(bd)O(b^d)O(bd) |
空间复杂度 | O(bm)O(b^m)O(bm) | O(bd)O(b^d)O(bd) |
注解:
策略:总是扩展路径消耗最小的节点NNN,NNN点的路径消耗等于前一点的路径消耗+前一点到NNN节点的路径消耗
一致代价搜索是BFS的扩展,使用优先队列而不是普通队列保存边缘中的状态;如果每一步的代价全部相等,则与BFS相同
一致代价搜索与Dijkstra算法的对比:
启发:应用特定的经验法则或从经验衍生出来的论据,提高解决复杂问题的效率
启发式搜索(Heuristic Search):利用启发方式获得的领域知识,通过限定搜索深度或者限定搜索宽度来缩小问题空间,避开没有结果的搜索路径,也称有信息搜索
模拟爬山过程,随机选择一个位置(节点)爬山,每次朝着更高的方向移动,直至山顶,即每次都在临近的空间中选择最优解作为当前解,直到局部最优解
从当前的节点开始,与周围的邻居节点的值进行比较
如果当前节点是最大的,那么返回当前节点,作为最大值(即山峰最高点);反之就用最高的邻居节点来替换当前节点,实现向山峰的高处攀爬的目的,直到达到最高点
爬山搜索的特点:
局部最优方法,不是全面搜索,结果可能不是最佳
一般存在以下问题:
算法会陷入局部最优解,能否得到全局最优解取决于初始点的位置
启发函数:一个关于节点的函数h(n)h(n)h(n),用于评估当前状态与目标状态接近的程度(例如用曼哈顿距离、欧几里得距离等)
h(n)≥0h(n)\ge 0h(n)≥0
h(n)h(n)h(n)越小,表示当前状态nnn越接近目标状态
h(n)=0h(n)=0h(n)=0表示已达到目标
启发搜索利用启发函数的值将问题状态的描述转化为问题解决程度的描述
评价函数:用于评价节点重要程度的函数,其主要任务是确定节点的优先级程度
评价函数f(n)f(n)f(n)的一般形式:f(n)=g(n)+h(n)f(n)=g(n)+h(n)f(n)=g(n)+h(n)
其中g(n)g(n)g(n)是从初始状态到当前状态已经付出的代价,h(n)h(n)h(n)是启发函数(从当前状态到目标状态的代价的评估)
f(n)=g(n)f(n)=g(n)f(n)=g(n):等代价搜索,按照已付出的代价进行搜索(如广度优先搜索),具有完备性
f(n)=h(n)f(n)=h(n)f(n)=h(n):按照启发函数向最靠近目标的状态(节点)搜索(如贪婪搜索),不具有完备性
贪婪最佳优先搜索:试图扩展离目标最近的节点以便尽快找到问题的解
评价函数f(n)f(n)f(n)仅使用启发式信息:f(n)=h(n)f(n)=h(n)f(n)=h(n),仅依赖从当前状态到目标状态间的剩余距离
局部择优选取,其自的不是为了找到全部解,而只是找出一种可行解(当前条件下的最优)含当然找不出全局最优解,但具有高效性
大部分的贪婪算法都是基于图的方式寻找最优路径
核心:每一步试图找离目标最近的节点
贪婪最佳优先搜索的特点:
例 (洛谷P3817 小A的糖果) 小A有nnn个糖果盒,第iii盒有aia_iai个糖果。小AAA每次可以从其中一盒糖果中吃掉一颗,他想知道,要让任意两个相邻的盒子中糖的个数之和都不大于xxx,至少得吃掉几颗糖。
分析 假设从第iii盒吃cic_ici个,求miny=∑i=1ncis.t.(ai−ci)+(ai+1−ci+1)≤x,1≤i≤n−10≤ci≤ai,1≤i≤n\min y=\sum\limits_{i=1}^n c_i\\s.t.\ (a_i-c_i)+(a_{i+1}-c_{i+1})\le x,\ 1\le i\le n-1\\ 0\le c_i\le a_i,\ 1\le i\le n miny=i=1∑ncis.t. (ai−ci)+(ai+1−ci+1)≤x, 1≤i≤n−10≤ci≤ai, 1≤i≤n这个问题中,每个状态即为当前各盒的糖果数,目标状态满足相邻两盒糖果数之和小于等于xxx,初始状态为s0=(a1,a2,⋯,an)s_0=(a_1,a_2,\cdots,a_n)s0=(a1,a2,⋯,an),状态转移为从某盒吃掉一个糖果。
设当前状态为sss,sss状态下第iii盒剩余的糖果数为bi(s)b_i^{(s)}bi(s),bi(s0)=aib_i^{(s_0)}=a_ibi(s0)=ai。定义启发函数h(s)=∑i=1n−1max(0,bi(s)+bi+1(s)−x)h(s)=\sum\limits_{i=1}^{n-1}\max\left(0,b_i^{(s)}+b_{i+1}^{(s)}-x\right)h(s)=i=1∑n−1max(0,bi(s)+bi+1(s)−x),目标状态ttt的启发函数值h(t)=0h(t)=0h(t)=0。对于任何当前状态sss,设下一状态为uuu,如果吃两端(第111盒或第nnn盒)最多只能使h(u)≥h(s)−1h(u)\ge h(s)-1h(u)≥h(s)−1,而吃中间的(第2,3,⋯,n−12,3,\cdots,n-12,3,⋯,n−1盒)至多使h(u)≥h(s)−2h(u)\ge h(s)-2h(u)≥h(s)−2,所以吃任何中间的都是最优的。同时,如果ai−1+ai>xa_{i-1}+a_i>xai−1+ai>x且ai+ai+1>xa_{i}+a_{i+1}>xai+ai+1>x,那么吃第iii盒能使h(u)=h(s)−2h(u)=h(s)-2h(u)=h(s)−2,最划算。综上,对于ai(2≤i≤n)a_i(2\le i\le n)ai(2≤i≤n),若bi−1+ai>xb_{i-1}+a_i>xbi−1+ai>x,则令ci=ai+1+ai−xc_i=a_{i+1}+a_i-xci=ai+1+ai−x,使得bi=ai−ci−1b_i=a_i-c_{i-1}bi=ai−ci−1。(即ci=max(0,bi−1+ai−x)c_i=\max(0,b_{i-1}+a_i-x)ci=max(0,bi−1+ai−x)。)代码如下:
#include using namespace std;const int MAXN = 1e5 + 5;
int n, x, a[MAXN], b[MAXN];int main()
{cin >> n >> x;for(int i = 1; i <= n; ++i) cin >> a[i];long long y = 0;b[1] = a[1];for(int i = 2; i <= n; ++i){if(b[i - 1] + a[i] > x){int c = b[i - 1] + a[i] - x;y += c;b[i] = a[i] - c;}else{b[i] = a[i];}}cout << y << endl;return 0;
}
算法的最优性证明如下:若该策略不是最优,假设有比我们的答案yyy更小的y′y'y′,不妨设y′=y−1y'=y-1y′=y−1,则必∃j(2≤j≤n)\exists j(2\le j\le n)∃j(2≤j≤n)使得ci′=ci−1c_i'=c_i-1ci′=ci−1。我们知道,ci=max(0,bi−1+ai−x)(2≤i≤n)c_i=\max(0,b_{i-1}+a_i-x)(2\le i\le n)ci=max(0,bi−1+ai−x)(2≤i≤n),当bi−1+ai−x>0b_{i-1}+a_i-x>0bi−1+ai−x>0时,bi−1+bi=xb_{i-1}+b_{i}=xbi−1+bi=x。但ci′=ci−1c_i'=c_i-1ci′=ci−1,使得bi′=bi+1b_i'=b_i+1bi′=bi+1,此时bi−1+bi=x+1>xb_{i-1}+b_i=x+1>xbi−1+bi=x+1>x,所以条件不满足,矛盾。因此我们的策略是最优策略。
A算法的评价函数f(n)=g(n)+h(n)f(n)=g(n)+h(n)f(n)=g(n)+h(n),其中:
优先扩展f(n)f(n)f(n)最小的节点进行扩展
A*搜索:最小化总的解决方案代价估计值的最佳优先搜索
A算法对评价函数中的启发函数未做任何规定,不能评价搜索结果的优劣
A*算法的评估函数f∗(n)=g∗(n)+h∗(n)f^*(n)=g^*(n)+h^*(n)f∗(n)=g∗(n)+h∗(n),其中:
与A算法相比(参考Stackexchange):
保证A*搜索最优化的条件:
A*搜索使用到当前的路径代价g(n)g(n)g(n)+到目标的最低路径代价h(n)h(n)h(n)。若启发函数h(n)h(n)h(n)满足下列条件,则A*算法既完备又最优:
启发式搜索的特点:
启发式搜索(以及一致代价搜索)总结:
算法 | 种类 | 估价函数 | 完备性 | 最优性 | 最坏情况下的时间、空间复杂度 |
---|---|---|---|---|---|
一致代价搜索 | 盲目式搜索 | f(n)=g(n)f(n)=g(n)f(n)=g(n) | 完备 | 最优(如果路径代价是节点深度的非递减函数) 不一定最优(通常情况下 | O(bd)O(b^d)O(bd)(bbb为分支因子,ddd为解的深度) |
爬山搜索 | 启发式搜索 | - | 不完备 | 非最优(仅局部最优) | - |
贪婪搜索 | 启发式搜索 | f(n)=h(n)f(n)=h(n)f(n)=h(n) | 不完备 | 非最优 | O(bm)O(b^m)O(bm)(bbb为分支因子,mmm为搜索空间最大深度) |
A算法 | 启发式搜索 | f(n)=g(n)+h(n)f(n)=g(n)+h(n)f(n)=g(n)+h(n) | - | 不一定 | - |
A*算法 | 启发式搜索 | f∗(n)=g∗(n)+h∗(n)f^*(n)=g^*(n)+h^*(n)f∗(n)=g∗(n)+h∗(n)(可用h(n)h(n)h(n)代替h∗(n)h*(n)h∗(n)) | 启发函数满足条件则完备 | 启发函数满足条件则最优 | - |
盲目搜索与启发式搜索的对比: