C++代码实现字符串模式匹配的Sunday算法
Sunday算法由Daniel M.Sunday在1990年提出,它的思想跟BM算法很相似:
只不过Sunday算法是从前往后匹配,在匹配失败时关注的是文本串中参加匹配的最末位字符的下一位字符
如果该字符没有在模式串中出现则直接跳过,一直移动到该字符之后出现的第一个与模式串首字符相同的字符,即移动位数 = 模式串长度 + 该字符之后出现的第一个与模式串首字符相同的字符到该字符的距离
否则,其移动位数 = 模式串中最右端的该字符到末尾的距离+1
下面举个例子说明下Sunday算法。假定现在要在文本串”substring sasearching algorithm”中查找模式串”search”
刚开始时,把模式串与文本串左边对齐:
substring sasearching algorithm
search
^结果发现在第2个字符处发现不匹配,不匹配时关注文本串中参加匹配的最末位字符的下一位字符,即标粗的字符 i,因为模式串search中并不存在i,所以模式串直接跳过一大片,向右移动位数 = 模式串长度 + 该字符之后出现的第一个与模式串首字符相同的字符到该字符的距离 = 6 + 4 = 10,从 i 之后的第一个与模式串首字符相同的字符(即字符s)开始下一步的匹配,如下图:
substring sasearching algorithm
search ^
结果第3个字符处不匹配,再看文本串中参加匹配的最末位字符的下一位字符,是’c’,它出现在模式串中的倒数第2位,于是把模式串向右移动2位(r 到模式串末尾的距离 + 1 = 1 + 1 =2),使两个’c’对齐,如下:
substring sasearching algorithm
search
^匹配成功
回顾整个过程,我们只移动了两次模式串就找到了匹配位置,缘于Sunday算法每一步的移动量都比较大,效率很高
下面给出C++实现Sunday算法的代码
1 |
|
作为对比,再给出KMP算法的实现代码,之后可以运行来看看两个的性能差距
1 |
|
Sunday算法的运行时间如图:
KMP算法的运行时间如图:
可以看到Sunday算法的效率更高