KMP算法是字符串模式匹配当中最经典的算法,原来大二学数据结构的有讲,但是当时只是记住了原理,但不知道代码实现,今天终于是完成了KMP的代码实现。
原理
KMP的原理其实很简单,给定一个字符串和一个模式串,然后找模式串在给定字符串中的位置。将两个字符串转换为字符数组,然后从两个数组的开始位置"i","j"开始匹配,如果相同,执行"i++","j++"接着比较下一位;如果不相同,就转到模式串对应next数组的对应位置"next[j]"然后从该位置开始继续与给定字符串的当前位置"i"进行比较,换句话说就是将模式串提前了"j-next[j]"位继续比较,不至于每次出现不匹配就又重新回到开始位置进行匹配,充分利用了已匹配过的位置。
代码
KMP算法的关键是得到模式串的next数组:
public static int[] next(char[] p) {
int len = p.length;
int[] next = new int[len];
next[0] = 0;
next[1] = 0; //首先给next[0]和next[1]赋值,这两个数字是固定的
for(int i = 2; i < len; i++) {
int k = next[i - 1]; //用一个整型数字进行遍历
while(k >= 0) {
if(p[i - 1] == p[k]) {
next[i] = k + 1; //当匹配到字符时就能得到当前位置的next值,然后结束循环
break;
}
k--;
}
}
return next;
}
得到next数组之后就可以进行KMP匹配:
public int kmpSearch(char[] s, char[] p) {
int i = 0, j = 0; //从0开始
int slen = s.length, plen = p.length;
int[] next = next(p);
while(i < slen && j < plen) {
if(s[i] == p[j]) { //挨个进行匹配
i++;
j++;
} else {
j = next[j]; //如果不相等,返回next[j]位置继续向后匹配,不用和前面的进行比较
}
}
if(j == plen) //如果匹配到最后,说明匹配成功,返回匹配成功的开始位置
return i - j;
return -1; //否则就是匹配失败,返回-1
}
KMP算法还有一个进阶的next算法,求nextval数组:
public int[] nextVal(char[] p) {
int len = p.length;
int[] nextval = new int[len];
nextval[0] = -1;
int i=-1, j = 0;
while(j < len - 1) {
if(i == -1 || p[j] == p[i]) {
++i;
++j;
if(p[j] != p[i])
nextval[j] = i;
else
nextval[j] = nextval[i];
}else
i = nextval[i];
}
return nextval;
}
KMP算法的更多相关文章
-
简单有效的kmp算法
以前看过kmp算法,当时接触后总感觉好深奥啊,抱着数据结构的数啃了一中午,最终才大致看懂,后来提起kmp也只剩下“奥,它是做模式匹配的”这点干货.最近有空,翻出来算法导论看看,原来就是这么简单(先不说 ...
-
萌新笔记——用KMP算法与Trie字典树实现屏蔽敏感词(UTF-8编码)
前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"* ...
-
KMP算法实现
链接:http://blog.csdn.net/joylnwang/article/details/6778316 KMP算法是一种很经典的字符串匹配算法,链接中的讲解已经是很明确得了,自己按照其讲解 ...
-
数据结构与算法JavaScript (五) 串(经典KMP算法)
KMP算法和BM算法 KMP是前缀匹配和BM后缀匹配的经典算法,看得出来前缀匹配和后缀匹配的区别就仅仅在于比较的顺序不同 前缀匹配是指:模式串和母串的比较从左到右,模式串的移动也是从 左到右 后缀匹配 ...
-
扩展KMP算法
一 问题定义 给定母串S和子串T,定义n为母串S的长度,m为子串T的长度,suffix[i]为第i个字符开始的母串S的后缀子串,extend[i]为suffix[i]与字串T的最长公共前缀长度.求出所 ...
-
字符串模式匹配之KMP算法图解与 next 数组原理和实现方案
之前说到,朴素的匹配,每趟比较,都要回溯主串的指针,费事.则 KMP 就是对朴素匹配的一种改进.正好复习一下. KMP 算法其改进思想在于: 每当一趟匹配过程中出现字符比较不相等时,不需要回溯主串的 ...
-
算法:KMP算法
算法:KMP排序 算法分析 KMP算法是一种快速的模式匹配算法.KMP是三位大师:D.E.Knuth.J.H.Morris和V.R.Pratt同时发现的,所以取首字母组成KMP. 少部分图片来自孤~影 ...
-
BF算法与KMP算法
BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符:若不相等,则比较S的 ...
-
KMP算法-next函数求解
KMP函数求解:一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为KMP算法.KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串 ...
随机推荐
-
ajax同步处理(使得JS按顺序执行)
在项目中碰到一个问题: 图一: 图二: 函数1代码:这里是因为有ajax请求,默认的是异步的 //点击分页页码,请求后台返回对应页码的数据 function getdata(fewPage,flag, ...
-
矩阵分解ALS方法
目标函数 优化目标函数 利用坐标下降法,依次更新u和v的值.u和v的先后顺序无所谓,只要保证两者是交替更新的就好.这种方法又称为alternating least squares(ALS). 增加偏置 ...
-
MFC Edit控件 追加文本
// 追加文本到EditControl void InstmDebugMainDlg::AppendText(int controlId, CString strAdd) { ((CEdit* ...
-
教你如何通过ICCID找回丢失的的iPhone
22日晚买了FACETIME,在某宝上买的.价格不贵,可以查到偷手机的人注册FT的号码,还可以查询手机被刷机和被维修的日期(这个很关键) 27日手机被刷机,遂买了某宝查询ICCID的服务,找到一串IC ...
-
MsSqlServer bak文件数据导入
MsSqlServer bak文件数据导入 第一步首先在你的数据库中建立一个空数据库 选中新建的数据库 鼠标右键 任务 还原 数据库 这个时候会弹出这种一个框 之后选择原设备 会弹出 点击加入 找到 ...
-
编写一条sql命令,sql删除没有中文的表
删除包含中文的 和不饱和中文的字段 SHOW create table pages; drop table if exists `film`; CREATE TABLE `film` ( `id` i ...
-
MongoDB Sharding分片 shell 脚本
#!/bin/sh CONFIG_NAME=$ CONFIG_PORT=$ SERIAL_NUM=$ STORAGE_HOME=$ if [ ! -n "$CONFIG_NAME" ...
-
PopupWindow 以及拍照、裁剪
实现这样的效果 圆角图片的自定义控件直接拷进来,和com一个等级 想要弹出内容可以使用悬浮窗 layout_pupup <LinearLayout xmlns:android="htt ...
-
通过Socket实现TCP编程,用户登录之服务器相应客户端,客户端和服务端之间的通信
服务器端: 1.创建ServerSocket对象,绑定监听端口: 2.通过accept()方法监听客户端请求: 3.建立连接后通过输入流读取客户端发送的请求信息; 4.通过输出流向客户端发送响应信息; ...
-
安装torch-opencv
安装torch-opencv torch torch-opencv opencv-3.1.0 opencv-contrib 想在torch中使用光流法,于是就希望能够调用opencv中的光流代码,而t ...