【文件属性】:
文件名称:mpcnn-text-similarity:基于MP-CNN的中文句子相似度计算
文件大小:34.29MB
文件格式:ZIP
更新时间:2021-05-10 18:41:32
Python
功能描述
基于MP-CNN的中文句子相似度计算
环境搭建
Ubuntu:16.04(64bit)
Anaconda:2-4.4.0(python 2.7)
历史版本下载:
TensorFlow:1.5.1
numpy:1.14.3
gensim:3.4.0
(nltk:3.2.3)
jieba:0.39
word2wec中文训练模型
参考链接:
代码使用
模型训练
# python train.py
论文参考
代码参考
AETC2018赛题描述
相关链接:
【文件预览】:
mpcnn-text-similarity-master
----utils.py(2KB)
----train.py(12KB)
----data_helper.py(702B)
----input_helpers.py(10KB)
----.DS_Store(6KB)
----log_1525700642.txt(1.72MB)
----__init__.py(0B)
----preliminary_contest()
--------models()
--------eval.py(3KB)
--------input_helpers.py(2KB)
--------dict.txt(71B)
--------preprocess.py(2KB)
--------atec_nlp_sim_train.csv(3.36MB)
--------run.sh(40B)
--------vocab()
----dict.txt(71B)
----preprocess.py(2KB)
----model.py(11KB)
----.gitignore(23B)
----README.md(805B)
----train_data()
--------atec_nlp_sim_train.csv(8.79MB)
--------train_corpus.txt(8.97MB)
----word2vec_model.bin(6.83MB)
----validation.txt0(144KB)