博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
编辑距离
阅读量:6114 次
发布时间:2019-06-21

本文共 979 字,大约阅读时间需要 3 分钟。

  编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。

  许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
  例如将 kitten一字转成sitting:
  sitten (k→s)
  sittin (e→i)
  sitting (→g)
  俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。
  
应用
  DNA分析
  拼字检查
  语音辨识
  抄袭侦测
  
算法
  动态规划经常被用来作为这个问题的解决手段之一。
  整数 Levenshtein距离(字符串 str1[1..m], 字符串 str2[1..n])
  //声明变量, d[i , j]用于记录str1[1...i]与str2[1..j]的Levenshtein距离
  int d[0..m, 0..n]   //初始化
  for i from 0 to m
  d[i, 0] := i
  for j from 0 to n
  d[0, j] := j
  //用动态规划方法计算Levenshtein距离
  for i from 1 to m
  for j from 1 to n
  {
  //计算替换操作的代价,如果两个字符相同,则替换操作代价为0,否则为1
  if str1[i]== str2[j] then cost := 0
  else cost := 1
  //d[i,j]的Levenshtein距离,可以有
  d[i, j] := minimum(
  d[i-1, j] + 1, //在str2上j位置删除字符(或者在str1上i-1位置插入字符)
  d[i, j-1] + 1, //在str2上j-1位置插入字符(或者在str1上i位置删除字符)
  d[i-1, j-1] + cost // 替换操作
  )
  }
  //返回d[m, n]
  return d[m, n]
  wikisource上有不同的编程语言的版本。

转载于:https://www.cnblogs.com/fdipzone/archive/2011/12/30/3715177.html

你可能感兴趣的文章
eclipse中将一个项目作为library导入另一个项目中
查看>>
Go语言学习(五)----- 数组
查看>>
Android源码学习之观察者模式应用
查看>>
Content Provider的权限
查看>>
416. Partition Equal Subset Sum
查看>>
centos7.0 64位系统安装 nginx
查看>>
数据库运维平台~自动化上线审核需求
查看>>
注解开发
查看>>
如何用 Robotframework 来编写优秀的测试用例
查看>>
Django之FBV与CBV
查看>>
Vue之项目搭建
查看>>
app内部H5测试点总结
查看>>
Docker - 创建支持SSH服务的容器镜像
查看>>
[TC13761]Mutalisk
查看>>
三级菜单
查看>>
Data Wrangling文摘:Non-tidy-data
查看>>
加解密算法、消息摘要、消息认证技术、数字签名与公钥证书
查看>>
while()
查看>>
常用限制input的方法
查看>>
Ext Js简单事件处理和对象作用域
查看>>