启发式搜索(heuristic search)———A*算法

时间:2022-09-13 11:06:18

 

 

 在宽度优先和深度优先搜索里面,我们都是根据搜索的顺序依次进行搜索,可以称为盲目搜索,搜索效率非常低。

而启发式搜索则大大提高了搜索效率,由这两张图可以看出它们的差别:

启发式搜索(heuristic search)———A*算法(左图类似与盲搜,右图为启发式搜索)(图片来源)  启发式搜索(heuristic search)———A*算法

 

 

很明显启发式的搜索效率远远大于盲搜。

什么是启发式搜索(heuristic  search)

  利用当前与问题有关的信息作为启发式信息,这些信息是能够提升查找效率以及减少查找次数的。

如何使用这些信息,我们定义了一个估价函数 h(x) 。h(x)是对当前状态x的一个估计,表示 x状态到目标状态的距离。

有:1、h(x) >= 0 ;  2、h(x)越小表示 x 越接近目标状态; 3、如果 h(x) ==0 ,说明达到目标状态。

与问题相关的启发式信息都被计算为一定的 h(x) 的值,引入到搜索过程中。

  然而,有了启发式信息还不行,还需要起始状态到 x 状态所花的代价,我们称为 g(x) 。比如在走迷宫问题、八数码问题,我们的 g(x) 就是从起点到 x 位置花的步数 ,h(x) 就是与目标状态的曼哈顿距离或者相差的数目;在最短路径中,我们的 g(x) 就是到 x 点的权值,h(x)  就是 x 点到目标结点的最短路或直线距离。

  现在,从 h(x) 和 g(x) 的定义中不能看出,假如我们搜索依据为 F(x) 函数。

  当 F(x) = g(x) 的时候就是一个等代价搜索,完全是按照花了多少代价去搜索。比如 bfs,我们每次都是从离得近的层开始搜索,一层一层搜 ;以及dijkstra算法,也是依据每条边的代价开始选择搜索方向。 

  当F(x) = h(x) 的时候就相当于一个贪婪优先搜索。每次都是向最靠近目标的状态靠近。

  人们发现,等代价搜索虽然具有完备性,能找到最优解,但是效率太低。贪婪优先搜索不具有完备性,不一定能找到解,最坏的情况下类似于dfs。

  这时候,有人提出了A算法。令F(x) = g(x) + h(x) 。(这里的 h(x) 没有限制。虽然提高了算法效率,但是不能保证找到最优解,不适合的 h(x)定义会导致算法找不到解。不具有完备性和最优性

  几年后有人提出了 A*算法。该算法仅仅对A算法进行了小小的修改。并证明了当估价函数满足一定条件,算法一定能找到最优解。估价函数满足一定条件的算法称为A*算法。

它的限制条件是 F(x) = g(x) + h(x) 。 代价函数g(x) >0 ;h(x) 的值不大于x到目标的实际代价 h*(x) 。即定义的 h(x) 是可纳的,是乐观的

怎么理解第二个条件呢?

  打个比方:你要从x走到目的地,那么 h(x) 就是你感觉或者目测大概要走的距离,h*(x) 则是你到达目的地后,发现你实际走了的距离。你预想的距离一定是比实际距离短,或者刚好等于实际距离的值。这样我们称你的 h(x) 是可纳的,是乐观的。

 不同的估价函数对算法的效率可能产生极大的影响。尤其是 h(x) 的选定,比如在接下来的八数码问题中,我们选择了曼哈顿距离之和作为 h(x) ,你也可以选择相差的格子作为 h(x),只不过搜索的次数会不同。当 h(x) 越接近 h*(x) ,那么扩展的结点越少!

  那么A*算法的具体实现是怎么样的呢?

1、将源点加入open表 2while(OPEN!=NULL) { 从OPEN表中取f(n)最小的节点n; if(n节点==目标节点) break; for(当前节点n的每个子节点X) { 计算f(X); if(XinOPEN) if(新的f(X)<OPEN中的f(X)) { 把n设置为X的父亲; 更新OPEN表中的f(n); //不要求记录路径的话可以直接加入open表,旧的X结点是不可能比新的先出队
 } if(XinCLOSE) continue; if(Xnotinboth) { 把n设置为X的父亲; 求f(X); 并将X插入OPEN表中; } }//endfor
 将n节点插入CLOSE表中; 按照f(n)将OPEN表中的节点排序;//实际上是比较OPEN表内节点f的大小,从最小路径的节点向下进行。
}//endwhile(OPEN!=NULL)

3、保存路径,从目标点出发,按照父节点指针遍历,直到找到起点。

 

以八数码问题为例:

我们从1、仅考虑代价函数; 2、仅考虑贪婪优先; 3、A*算法。

  1 #include<bits/stdc++.h>
  2 using namespace std;
  3 struct Maze{
  4     char s[3][3];
  5     int i,j,fx,gx;
  6     bool operator < (const Maze &a )const{
  7         return fx>a.fx;
  8     }
  9 } c;
 10 int fx[4][2]={{-1,0},{1,0},{0,1},{0,-1}};
 11 map<char ,Maze > mp;
 12 int T;
 13 int get_hx(char s[3][3]){
 14     int hx=0;
 15     for(int i=0;i<3;i++){
 16         for(int j=0;j<3;j++){
 17             hx+=abs(mp[s[i][j]].i-i)+abs(mp[s[i][j]].j-j);
 18         }
 19     }
 20     return (int)hx;
 21 }
 22 void pr(char s[3][3]){
 23     cout<<"step: "<<T++<<endl;
 24     for(int i=0;i<3;i++){
 25         for(int j=0;j<3;j++)
 26             cout<<s[i][j];
 27         cout<<endl;
 28     }
 29     cout<<endl;
 30 }
 31 int key(char s[3][3]){
 32     int ans=0;
 33     for(int i=0;i<3;i++)
 34         for(int j=0;j<3;j++)
 35             ans=ans*10+(s[i][j]-'0');
 36     return ans;
 37 }
 38 void BFS(){
 39     T=0;
 40     map<int ,bool >flag;
 41     queue < Maze > q;
 42     q.push(c);
 43     flag[key(c.s)]=1;
 44     while(!q.empty()){
 45         Maze now=q.front();
 46         q.pop();
 47         pr(now.s);
 48         if(get_hx(now.s)==0){
 49             break;
 50         }
 51         for(int i=0;i<4;i++){
 52             int x,y;
 53             x=now.i+fx[i][0];
 54             y=now.j+fx[i][1];
 55             if(!(x>=0&&x<3&&y>=0&&y<3)) continue;
 56             Maze tmp=now;
 57             tmp.s[now.i][now.j]=tmp.s[x][y];
 58             tmp.s[x][y]='0';
 59             tmp.i=x ; tmp.j=y ;
 60             tmp.fx++;
 61             if(!flag[key(tmp.s)]){
 62                 q.push(tmp);
 63                 flag[key(tmp.s)]=1;
 64             }
 65         }
 66     }
 67 }
 68 void Greedy_best_first_search(){
 69     T=0;
 70     priority_queue< Maze > q ;
 71     map<int ,int >flag;
 72     c.fx=get_hx(c.s);
 73     q.push(c);
 74     flag[key(c.s)]=1;
 75     while(!q.empty()){
 76         Maze now=q.top();
 77         q.pop();
 78         pr(now.s);
 79         if(get_hx(now.s)==0){
 80             break;
 81         }
 82         for(int i=0;i<4;i++){
 83             int x,y;
 84             x=now.i+fx[i][0];
 85             y=now.j+fx[i][1];
 86             if(!(x>=0&&x<3&&y>=0&&y<3)) continue;
 87             Maze tmp=now;
 88             tmp.s[now.i][now.j]=tmp.s[x][y];
 89             tmp.s[x][y]='0';
 90             tmp.i=x ; tmp.j=y ;
 91             tmp.fx=get_hx(tmp.s);
 92             if(!flag[key(tmp.s)]){
 93                 q.push(tmp);
 94                 flag[key(tmp.s)]=1;
 95             }
 96         }
 97     }
 98 }
 99 void A_star(){
100     T=0;
101     priority_queue< Maze > q ;
102     map<int ,int >flag;
103     c.gx=0;
104     c.fx=get_hx(c.s)+c.gx;
105     q.push(c);
106     while(!q.empty()){
107         Maze now=q.top();
108         q.pop();
109         flag[key(now.s)]=now.fx;
110         pr(now.s);
111         if(get_hx(now.s)==0){
112             break;
113         }
114         for(int i=0;i<4;i++){
115             int x,y;
116             x=now.i+fx[i][0];
117             y=now.j+fx[i][1];
118             if(!(x>=0&&x<3&&y>=0&&y<3)) continue;
119             Maze tmp=now;
120             tmp.s[now.i][now.j]=tmp.s[x][y];
121             tmp.s[x][y]='0';
122             tmp.i=x ; tmp.j=y ;
123             tmp.gx++;
124             tmp.fx=get_hx(tmp.s)+tmp.gx;
125             if(!flag[key(tmp.s)]){
126                 q.push(tmp);
127             }else if(flag[key(tmp.s)]>tmp.fx){
128                 flag[key(tmp.s)]=0;
129                 q.push(tmp);
130             }
131         }
132     }
133 }
134 int main(){
135     mp['1'].i=0;mp['1'].j=0;
136     mp['2'].i=0;mp['2'].j=1;
137     mp['3'].i=0;mp['3'].j=2;
138     mp['4'].i=1;mp['4'].j=2;
139     mp['5'].i=2;mp['5'].j=2;
140     mp['6'].i=2;mp['6'].j=1;
141     mp['7'].i=2;mp['7'].j=0;
142     mp['8'].i=1;mp['8'].j=0;
143     mp['0'].i=1;mp['0'].j=1;
144     for(int i=0;i<3;i++){
145         for(int j=0;j<3;j++){
146             cin>>c.s[i][j];
147         }
148         char x=getchar();
149     }
150     cin>>c.i>>c.j;
151     c.fx=0;
152     cout<<"八数码问题 BFS 解法(即仅以当前代价 g(x)搜索): "<<endl;
153     BFS();
154     cout<<"八数码问题 Greedy_best_first_search 解法(即仅以估计函数 h(x)搜索): "<<endl;
155     Greedy_best_first_search();
156     cout<<"八数码问题 A* 解法: "<<endl;
157     A_star();
158     return 0;
159 }
160 /*
161 283
162 164
163 705
164 2 1
165 */

结果显示:

1、仅考虑代价函数:36步。

2、仅考虑贪婪优先:5步。

3、A*算法:5步。

明显,在引入了启发式信息后,大大的提高了搜索的效率。

 

引申问题: 第 k 短路问题。

思路: 先从终点求出最短路,作为 h(x) 。然后维护优先队列,维护 F(x) 最小,第一次出来的终点是最短路,终点第二次出来的是次短路……

求第k短路时,A*算法优化的是查找的次数,可以理解为剪枝,更快速的找到最短路,次短路……
其他操作和正常的求最短路没有什么区别,找到终点第k次出队的值,就是第k短路。

(可能你会说在无向图中存在有回头路,没错,有可能次短路只是最短路走了一次回头路,但这确实也是一条次短路)。