文件名称:计算两篇文章相似度.zip
文件大小:3MB
文件格式:ZIP
更新时间:2024-06-22 04:17:20
python 查重
将网络小说《齐天传》拉出去与《西游记》进行查重,竟然意外的发现,重复率高达40%???使用python结巴库实现两篇文章的相似度计算。
【文件预览】:
计算两篇文章相似度
----西游记.txt(2.04MB)
----sim_calculation.py(798B)
----齐天传.txt(4.85MB)
文件名称:计算两篇文章相似度.zip
文件大小:3MB
文件格式:ZIP
更新时间:2024-06-22 04:17:20
python 查重
将网络小说《齐天传》拉出去与《西游记》进行查重,竟然意外的发现,重复率高达40%???使用python结巴库实现两篇文章的相似度计算。