【问题描述】设A和B是两个字符串,要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括:
(1)删除一个字符;
(2)插入一个字符;
(3)将一个字符改为另一个字符。
将字符串A变换为字符串B所用的最少字符操作数称为字符串A到B的编辑距离,记为d(A,B)。试设计一个有效算法,对任给的两个字符串A和B,计算出它们的编辑距离dp(A,B)。
图解如下:
第1行:
空字符串需要经过多少次变换才可以变成另一个空字符串,显然是0,所以第一空是0
空字符串需要经过多少次变换才可以变成字符串a, 显然是1次,即操作(2)
空字符串需要经过多少次变换才可以变成字符串ap, 显然是2次,即操作(2)
空字符串需要经过多少次变换才可以变成字符串app, 显然是3次,即操作(2)
以此类推得到如下表
第1列:
字符o需要经过多少次变换才可以变成空字符串,显然是1次,即操作(1)
字符op需要经过多少次变换才可以变成空字符串,显然是2次删除,即操作(1)
以此类推得到如下表
第2列:
字符o需要经过多少次变换才可以变成字符串a,因为两个字符不等,所以从相邻的三个元素中找最小值+1,其中,这个元素的左上角元素代表的含义是:经过多少次变换后已经变成它上面正对着的字符(操作3)
两个字符相等时,只需要copy左上角的元素
最后得到
#include<stdio.h>
#include<string.h>
//取a和b、c中最小的值
int min(int a, int b, int c)
{
int temp = a < b ? a : b;
return temp < c ? temp : c;
}
int myCharDistance(char str1[], char str2[])
{
int i, j, len1, len2;
int dist[100][100];
len1 = strlen(str1);
len2 = strlen(str2);
for(i = 0; i <= len1; i++)
dist[i][0] = i;
for(j = 0; j <= len2; j++)
dist[0][j] = j;
for(i = 1; i <= len1; i++)
for(j = 1; j <= len2; j++) {
//因为dist比str1和str2多了第0行和第0列,str是从下标0开始存数,而dist[]是从下标1才开始真正存数,
//所以dist[i]对应str[i - 1], 里一定要注意。
if(str1[i - 1] == str2[j - 1])
dist[i][j] = dist[i - 1][j - 1];
else {
int insert = dist[i][j - 1] + 1; //插入操作
int dele = dist[i - 1][j] + 1; //删除操作
int replace = dist[i - 1][j - 1] + 1; //替换操作
dist[i][j] = min(insert, dele, replace);
}
}
return dist[len1][len2];
}
int main()
{
char str1[100], str2[100];
gets(str1);
gets(str2);
printf("min distance between this two char is:%d\n", myCharDistance(str1, str2));
return 0;
}