文件名称:torchRL:用于记录链接的Fellegi-Sunter算法的Java实现
文件大小:61KB
文件格式:ZIP
更新时间:2024-05-30 14:55:36
Java
这是其他CSSIP项目使用的Java中的Fellegi-Sunter算法的实现。 它还包括一对一链接提取算法的实现。 通过运行来创建一个供其他程序使用的jar文件 mvn package 已知的问题: EM算法的收敛不稳定,很可能是由于实现中的错误所致。 另外,还有一种贝叶斯方法可以拟合记录链接参数,速度较慢,但输出是一致的。 Jaro-Winkler字符串比较的实现为短字符串返回0(少于4个字符)。 在完全匹配的情况下这不是问题,因为完全一致的协议需要单独测试,但这意味着该实现不应单独使用。 考虑用外部实现代替它。
【文件预览】:
torchRL-master
----src()
--------test()
--------main()
----README.md(838B)
----pom.xml(3KB)