描述:
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:
(1)删除一个字符;
(2)插入一个字符;
(3)将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的2个字符串A和B,计算出它们的编辑距离d(A,B)。
要求:
输入:第1行是字符串A,第2行是字符串B。
输出:字符串A和B的编辑距离d(A,B)
思路:
开一个二维数组d[i][j]来记录a0-ai与b0-bj之间的编辑距离,要递推时,需要考虑对其中一个字符串的删除操作、插入操作和替换操作分别花费的开销,从中找出一个最小的开销即为所求
具体算法:
首先给定第一行和第一列,然后,每个值d[i,j]这样计算:d[i][j] = min(d[i-1][j]+1, d[i][j-1]+1, d[i-1][j-1]+(s1[i]==s2[j]?0:1));
最后一行,最后一列的那个值就是最小编辑距离
二、算法分析
dp[i][j]表示a的前i个和b的前j个相同后的最短距离
dp[i][j]来自于三种状态{
1、删除,dp[i-1][j]+1;
2、插入,dp[i][j-1]+1;
3、替换,if(a[i]==b[j]) dp[i][j]=dp[i-1][j-1],else dp[i][j]=dp[i-1][j-1]+1;
三、代码:
#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std;
#define N 10
int dp[N][N];//dp[i][j]表示a的前i个和b的前j个相同后的最短距离
int main()
{
char a[N];
char b[N];
freopen("dInput.txt","r",stdin);
freopen("doutput.txt","w",stdout);
scanf("%s%s",a,b);
int la=strlen(a);
int lb=strlen(b);
for(int i=1;i<=la;i++)
dp[i][0]=i;
for(int j=1;j<=lb;j++)
dp[0][j]=j;
for(int i=1;i<=la;i++)
{
for(int j=1;j<=lb;j++)
{
int insert=dp[i][j-1]+1;
int deletes=dp[i-1][j]+1;
int replace;
if(a[i-1]==b[j-1])
replace=dp[i-1][j-1];
else
replace=dp[i-1][j-1]+1;
dp[i][j]=min(min(insert,deletes),replace);
}
}
printf("%d\n",dp[la][lb]);
return 0;
}