文件名称:apt_project:文本分析与检索 - 课程项目
文件大小:22.43MB
文件格式:ZIP
更新时间:2024-06-20 14:25:22
Java
apt_project 项目 需要从: ://www.nltk.org/nltk_data/packages/corpora/wordnet.zip 下载 WordNet 并放入文件夹:/data/nltk/corpora/wordnet/ 下载在文件夹 apt/features/karlo 中解压添加行:400000 50 到文件开头(字数,维度) jagar,对我来说,使用其他语料库很慢,但如果你想尝试它,在下尝试一些更大的语料库 '在哪里获得预训练模型',附带条件是如果它以 .bin 结尾,你应该在最后一行 word2vec.py 中放置'binary = True' 在txt文件中,您应该始终从头开始添加此行2)