使用MySQL进行全文索引

时间:2022-09-22 11:25:02

使用MYSQL进行全文索引

1. 背景

需要对数据库中某张表里的若干字段进行全文索引。

2. 分析

可以采用三种方法:
1. mysql全文索引
2. lucene进行索引
3. 将mysql数据库转为mongodb
最后决定使用mysql全文索引,省得编码了。

3. 步骤

基本步骤如下:
1. 需要修改数据库引擎,从innodb转为myiam
2. 建立全文索引
3. 查询使用

3.1 修改数据库引擎

use jyonline;
show tables;
alter table paper ENGINE=MyISAM;
alter table question ENGINE=MyISAM;

参考文献 链接

3.2 建立全文索引

对于英文的索引,MySQL很早就已经支持,然而对于中文的索引,MySQL早版本并不是支持的,因此在很早的版本中一般使用插件mysqlcft,在MySQL5.7版本开始支持中文索引。以下是针对5.7版本的中文索引。
早版本链接
5.7版本链接

编辑my.ini文件

首先从windows服务中寻找my.ini的位置,如下图所示。
使用MySQL进行全文索引

然后打开编辑如下:

[mysqld]
ngram_token_size=2

修改表,增加全文索引

show create table paper;
alter table paper add fulltext index ft_index(name) WITH PARSER ngram;

show create table question;
alter table question add fulltext index ft_index(html) WITH PARSER ngram;

3.3 查询应用

select name from paper where match(name) against('高中')

select html from question where match(html) against('集合');

4. 附录

4.1 查看和删除索引

# 查看并删除索引
SHOW CREATE TABLE paper;

------------------------------------
CREATE TABLE `paper` (
`id` varchar(36) NOT NULL COMMENT 'guid',
`html` longtext,
`subject` varchar(5) DEFAULT NULL COMMENT '学科:\n1,语文\n2,数学\n3,外语\n4,物理\n5,化学\n6,历史\n7,地理\n8,政治\n9,生物',
`grade` varchar(5) DEFAULT NULL COMMENT '包括初一,初二,初三,中考,高一,高二,高三,高考',
`name` varchar(100) DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `id_UNIQUE` (`id`),
FULLTEXT KEY `subject` (`subject`,`grade`,`name`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
-------------------------------------------
alter table paper drop index subject;


SHOW CREATE TABLE question;
-------------------------------------------
CREATE TABLE `question` (
`id` varchar(36) NOT NULL,
`html` text,
`answer` text,
`paper_id` varchar(36) NOT NULL,
`answer_url` varchar(100) DEFAULT NULL,
PRIMARY KEY (`id`),
FULLTEXT KEY `html` (`html`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
--------------------------------------------
alter table question drop index html;

4.2 全文索引的搜索方式

参考链接

主要包括三种:自然语言全文搜索、布尔全文搜索和查询扩展全文搜索。