本文实例讲述了PHP字典树(Trie树)定义与实现方法。分享给大家供大家参考,具体如下:
Trie树的概念(百度的解释):字典树又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
我的理解是用来做字符串搜索的,每个节点只包含一个字符,比如录入单词"world",则树的结构是:
这时再录入单词"worab",则树的结构为:
所以每个节点必须还要一个字段is_end标识是否为结束单词。比如用户输入wor,搜索所有wor开头的单词,假设现在有一个单词就是wor,从"w"开始检索,当检索到"r"的时候需要判断"r"节点的is_end为true,则把wor加入到结果列表,然后继续往下面检索。
PHP实现代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
|
<?php
class Node{
public $value ; // 节点值
public $is_end = false; // 是否为结束--是否为某个单词的结束节点
public $childNode = array (); // 子节点
/* 添加孩子节点--注意:可以不为引用函数,因为PHP对象赋值本身就是引用赋值 */
public function &addChildNode( $value , $is_end = false){
$node = $this ->searchChildNode( $value );
if ( empty ( $node )){
// 不存在节点,添加为子节点
$node = new Node();
$node ->value = $value ;
$this ->childNode[] = $node ;
}
$node ->is_end = $is_end ;
return $node ;
}
/* 查询子节点 */
public function searchChildNode( $value ){
foreach ( $this ->childNode as $k => $v ) {
if ( $v ->value == $value ){
// 存在节点,返回该节点
return $this ->childNode[ $k ];
}
}
return false;
}
}
/* 添加字符串 */
function addString(& $head , $str ){
$node = null;
for ( $i =0; $i < strlen ( $str ); $i ++) {
if ( $str [ $i ] != ' ' ){
$is_end = $i != ( strlen ( $str ) - 1) ? false : true;
if ( $i == 0){
$node = $head ->addChildNode( $str [ $i ], $is_end );
} else {
$node = $node ->addChildNode( $str [ $i ], $is_end );
}
}
}
}
/* 获取所有字符串--递归 */
function getChildString( $node , $str_array = array (), $str = '' ){
if ( $node ->is_end == true){
$str_array [] = $str ;
}
if ( empty ( $node ->childNode)){
return $str_array ;
} else {
foreach ( $node ->childNode as $k => $v ) {
$str_array = getChildString( $v , $str_array , $str . $v ->value);
}
return $str_array ;
}
}
/* 搜索 */
function searchString( $node , $str ){
for ( $i =0; $i < strlen ( $str ); $i ++) {
if ( $str [ $i ] != ' ' ){
$node = $node ->searchChildNode( $str [ $i ]);
// print_r($node);
if ( empty ( $node )){
// 不存在返回空
return false;
}
}
}
return getChildString( $node );
}
/* 调用测试开始 */
$head = new Node; // 树的head
// 添加单词
addString( $head , 'hewol' );
addString( $head , 'hemy' );
addString( $head , 'heml' );
addString( $head , 'you' );
addString( $head , 'yo' );
// 获取所有单词
$str_array = getChildString( $head );
// 搜索
$search_array = searchString( $head , 'hem' );
// 循环打印所有搜索结果
foreach ( $search_array as $key => $value ) {
echo 'hem' . $value . '<br>' ; // 输出带上搜索前缀
}
|
希望本文所述对大家PHP程序设计有所帮助。
原文链接:http://blog.csdn.net/mxdzchallpp/article/details/51684090