全文检索概述-the design and analysis of algorithms

时间:2024-06-29 04:39:01
【文件属性】:

文件名称:全文检索概述-the design and analysis of algorithms

文件大小:4.17MB

文件格式:PDF

更新时间:2024-06-29 04:39:01

达梦,DM7

23.1 全文检索概述 DM 全文检索根据已有词库建立全文索引,文本查询完全在索引上进行。全文索引为在 字符串数据中进行复杂的词搜索提供了有效支持。 用户可以在指定表的文本列上创建和删除全文索引。创建全文索引后全文索引未插入任 何索引信息。当用户填充全文索引时,系统才将定义了全文索引的文本列的内容进行分词, 并根据分词结果填充索引。用户可以在进行全文索引填充的列上使用 CONTAINS 谓词进行 全文检索。 DM7全文索引改进了原有的分词算法,为全文检索提供了更好的基础。在创建全文索引 成功后,假设索引名为 INDEX_NAME,则系统会自动产生如下相关的动态表: CTI$INDEX_NAME$I和 CTI$INDEX_NAME$P,其表结构如 23.1和 23.2所示。第一个 表主键为(WORD、FIRSTID、WID),用于保存分词结果,记录词的基本信息,通过该信息 就可以快速地定位到该词的基表记录;第二个表主键为(PND_DOCID),用于保存基表发生 的增量数据变化,用于修改全文索引时的增量填充。 表 23.1 CTI$INDEX_NAME$I表结构 序号 字段名 类型 长度 精度 刻度 说明 1 WID BIGINT 8 19 0 词 ID 2 WORD VARCHAR 64 64 0 词文本,相同的词重复存储 3 TYPE SMALLINT 2 5 0 词类型 4 FIRSTID BIGINT 8 19 0 开始 ROWID,用于范围查找 5 LASTID BIGINT 8 19 0 结束 ROWID 6 COUNT INTEGER 4 10 0 词所在的文档数(即 ROWID的个数) 7 ID_INFO BLOB 2G-1 2G-1 0 保存所在文档所有的 ROWID,连续存放 表 23.2 CTI$INDEX_NAME$P表结构 序号 字段名 类型 长度 精度 刻度 说明 1 PND_DOCID BIGINT 8 19 0 文档 ROWID 2 PND_YPTE SMALLINT 2 5 0 INS/UPD/DEL类型 例如对示例库 bookshop中的 address表的 address1列创建全文索引,创建的 SQL 语句如下。 CREATE CONTEXT INDEX cti_address ON person.address (address1) LEXER DEFAULT_LEXER;


网友评论