知识图谱问答系列文档（九）——从零开始搭建一个通用知识图谱问答【相似推荐、模型部署上线】

时间：2024-04-01 19:50:30

（八）相似实体

本文使用word2vec获取实体的词向量，并查找与实体相似的实体名，返回给用户（word2vec使用方法）。

（九）问题推荐

问题推荐包含热门问题和后端生成两部分，分别如下：

热门问题

热门问题推荐20条，包含五种功能类型，涉及人物、机构、省市、作品等，问题具有一定的规范性，与训练样本格式上相似。
后端生成

随机选取实体的其他五种属性，每种实体+属性的组合，使用simbert（examples/simbert_base.py）生成5个相似问题，再随机选取一条作为问题推荐，最终选取五条问题，推荐给用户。

（十）模型部署上线

模型部署上线使用flask web应用框架，知识图谱使用echarts展示，初步完成整个问答系统。

部分功能展示（查询地址）：

SP->O：

知识图谱问答系列文档（九）——从零开始搭建一个通用知识图谱问答【相似推荐、模型部署上线】

SPP->O：

知识图谱问答系列文档（九）——从零开始搭建一个通用知识图谱问答【相似推荐、模型部署上线】

OP->S：

知识图谱问答系列文档（九）——从零开始搭建一个通用知识图谱问答【相似推荐、模型部署上线】

SO->P：

知识图谱问答系列文档（九）——从零开始搭建一个通用知识图谱问答【相似推荐、模型部署上线】

结语：

本文第一次研究通用知识图谱问答，从数据预处理，到问答架构设计，再到整个系统的上线，共经历了三个月，中间遇到了各种各样的问题，通过不断地更新知识图谱，不断地增强训练样本，不断地优化问答流程，最终实现了100ms以内的通用知识图谱问答系统。

说明：本文代码尚未放入github，待本人整理完毕，将在此公开github地址，整理期间，欢迎各位一起交流学习。

