1. 实践题目
7-3 编辑距离问题
2. 问题描述
设A和B是2个字符串。要用最少的字符操作将字符串A转换为字符串B。这里所说的字符操作包括 (1)删除一个字符; (2)插入一个字符; (3)将一个字符改为另一个字符。 将字符串A变换为字符串B所用的最少字符操作数称为字符串A到 B的编辑距离,记为d(A,B)。 对于给定的字符串A和字符串B,计算其编辑距离 d(A,B)。
输入格式:
第一行是字符串A,文件的第二行是字符串B。
提示:字符串长度不超过2000个字符。
输出格式:
输出编辑距离d(A,B)
输入样例:
在这里给出一组输入。例如:
fxpimu
xwrs
输出样例:
在这里给出相应的输出。例如:
5
3. 算法描述
1 #include <iostream> 2 #include <string> 3 using namespace std; 4 5 string A, B; 6 int n1, n2; 7 int n[2002][2002]; 8 9 int main() 10 { 11 getline(cin, A); 12 getline(cin, B); 13 int a = A.length(); 14 int b = B.length(); 15 for(int i=1; i<=a; i++) 16 { 17 n[i][0] = i; 18 } 19 for(int j=1; j<=a; j++) 20 { 21 n[0][j] = j; 22 } 23 for(int i=1; i<=a; i++) 24 { 25 for(int j=1; j<=b; j++) 26 { 27 if(A[i-1]==B[j-1]) 28 { 29 n[i][j] = n[i-1][j-1]; 30 } 31 else 32 { 33 n[i][j] = min(min(n[i-1][j]+1, n[i][j-1]+1),n[i-1][j-1]+1); 34 } 35 } 36 } 37 cout << n[a][b]; 38 return 0; 39 }
4. 算法时间&空间复杂度分析
代码第23行到36行是本程序中嵌套层数最多的地方,共嵌套2层for循环,因此,算法时间复杂度级别为O(n2)。
由于本程序开辟了一个二维数组来存放从i到j的最短编辑距离,因此,算法空间复杂度级别也为O(n2)。
5. 心得体会
我在初次看到这题的时候,由于题目内容涉及到字符串的处理,我又最近自学了Python 3,深感Python字符串处理的简便,于是使用Python以相同的递归方程写了代码提交,测试结果为:
测试点0答案正确,耗时220ms,内存36116KB;测试点1答案正确,耗时215ms,内存35880KB;测试点2运行超时。
在进行各种尝试都无法成功使程序通过2号测试点的测试后,想到是与语言相关的问题,于是按同一个方程写C++程序,一遍过,三个测试点的耗时分别为3 / 5 / 44ms,内存占用分别为384 / 512 / 11436KB。
Python是一种动态类型、解释型的语言。查阅资料得知,其万物皆对象的特性就是导致其运行慢的一个原因,Python的对象模型会带来低效的内存访问。
因此,对于时间和内存要求不高的题目可以用Python写(缩进为主的代码风格可读性强,编写简单),如果要求较高,还是使用C++为好。
经过这次实践,我还发现了C++里面#include <string>之后string类的操作其实也非常便捷,并不输给Python,需要掌握这种用法。