使用MYSQL进行全文索引
1. 背景
需要对数据库中某张表里的若干字段进行全文索引。
2. 分析
可以采用三种方法:
1. mysql全文索引
2. lucene进行索引
3. 将mysql数据库转为mongodb
最后决定使用mysql全文索引,省得编码了。
3. 步骤
基本步骤如下:
1. 需要修改数据库引擎,从innodb转为myiam
2. 建立全文索引
3. 查询使用
3.1 修改数据库引擎
use jyonline;
show tables;
alter table paper ENGINE=MyISAM;
alter table question ENGINE=MyISAM;
参考文献 链接
3.2 建立全文索引
对于英文的索引,MySQL很早就已经支持,然而对于中文的索引,MySQL早版本并不是支持的,因此在很早的版本中一般使用插件mysqlcft,在MySQL5.7版本开始支持中文索引。以下是针对5.7版本的中文索引。
早版本链接
5.7版本链接
编辑my.ini文件
首先从windows服务中寻找my.ini的位置,如下图所示。
然后打开编辑如下:
[mysqld]
ngram_token_size=2
修改表,增加全文索引
show create table paper;
alter table paper add fulltext index ft_index(name) WITH PARSER ngram;
show create table question;
alter table question add fulltext index ft_index(html) WITH PARSER ngram;
3.3 查询应用
select name from paper where match(name) against('高中')
select html from question where match(html) against('集合');
4. 附录
4.1 查看和删除索引
# 查看并删除索引
SHOW CREATE TABLE paper;
------------------------------------
CREATE TABLE `paper` (
`id` varchar(36) NOT NULL COMMENT 'guid',
`html` longtext,
`subject` varchar(5) DEFAULT NULL COMMENT '学科:\n1,语文\n2,数学\n3,外语\n4,物理\n5,化学\n6,历史\n7,地理\n8,政治\n9,生物',
`grade` varchar(5) DEFAULT NULL COMMENT '包括初一,初二,初三,中考,高一,高二,高三,高考',
`name` varchar(100) DEFAULT NULL,
PRIMARY KEY (`id`),
UNIQUE KEY `id_UNIQUE` (`id`),
FULLTEXT KEY `subject` (`subject`,`grade`,`name`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
-------------------------------------------
alter table paper drop index subject;
SHOW CREATE TABLE question;
-------------------------------------------
CREATE TABLE `question` (
`id` varchar(36) NOT NULL,
`html` text,
`answer` text,
`paper_id` varchar(36) NOT NULL,
`answer_url` varchar(100) DEFAULT NULL,
PRIMARY KEY (`id`),
FULLTEXT KEY `html` (`html`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8
--------------------------------------------
alter table question drop index html;
4.2 全文索引的搜索方式
主要包括三种:自然语言全文搜索、布尔全文搜索和查询扩展全文搜索。