文件名称:java文本查重工具类封装
文件大小:28KB
文件格式:RAR
更新时间:2021-03-02 08:26:49
余弦定理 simhash 文本查重
终于重构好代码了,使用模式:模板模式、策略模式、建造者模式、单一职责,弄一个余弦定理、simhash文本查重代码,并使用二叉排序树和平衡二叉树(待测试)来优化查询。百万数据查重秒查
【文件预览】:
wgh-similar
----pom.xml(1KB)
----target()
--------test-classes()
--------classes()
----.settings()
--------org.eclipse.m2e.core.prefs(90B)
--------org.eclipse.wst.common.project.facet.core.xml(172B)
--------org.eclipse.core.resources.prefs(119B)
--------org.eclipse.wst.common.component(249B)
--------org.eclipse.wst.validation.prefs(50B)
--------org.eclipse.jdt.core.prefs(736B)
----src()
--------test()
--------main()
----.project(1KB)
----.classpath(1KB)