文件名称:wsm-vector-space-model:网络搜索和挖掘-向量空间模型
文件大小:2.81MB
文件格式:ZIP
更新时间:2024-04-25 10:04:44
Python
向量空间模型 Web挖掘和搜索课程实践项目 在实践中建立向量空间模型,以通过用户查询检索相关性最高的前10个文档。 如何运行代码 启动环境 pip install -r requirements.txt 跑步 python main.py --query {query_str} 注意 : query_str应该在“”内输入。 查询应以空格分隔。 例子 : python main.py --query "Trump Biden * China" 输出:得分最高的前10个新闻ID 词项频率加权+余弦相似度 项频率加权+欧式距离 TF-IDF加权+余弦相似度 TF-IDF加权+欧式距离 相关性反馈-TF-IDF +余弦相似度 该代码在我的计算机上运行了很长时间。 大约30分钟:(