文件名称:家谱java源码-Places:家谱定位器
文件大小:15.85MB
文件格式:ZIP
更新时间:2024-07-01 17:31:39
系统开源
家谱java源码该项目的目的是将地点文本与包含地理位置信息的当前和历史标准化地点数据库相匹配。 . 数据库 该数据库包含超过 400,000 个当前和历史人口居住地和更高级别的政治管辖区(区、县、省、州等)。 它基于 wiki 页面上的地方。 该数据库包括地名、类型(例如,城市、县等)替代名称、在 1900 年代早期就位的管辖等级、更早和更晚的管辖等级以及地理位置坐标。 当然,数据库离完成还有很长的路要走。 随着时间的推移,WeRelate 贡献者继续改进数据库。 WeRelate 地点的更新将定期添加到数据库中。 匹配算法 匹配算法不到1000行代码。 它是用 Java 编写的,但可以移植到其他语言。 它基本上尝试从右到左匹配位置,寻找先前匹配级别的子管辖区,如果没有找到则跳过中间级别。 即使文本在级别之间不包含逗号,它也可以匹配位置文本。 该算法速度很快,在单个线程上每秒匹配大约 100K 个位置。 该算法具有三种模式: BEST - 获得最近的地方; 如果不能匹配最左边的级别,则返回匹配的最低级别, 必需- 如果您无法匹配最左侧的级别,请不要返回任何内容, 新- 如果您无法匹配左
【文件预览】:
Places-master
----service()
--------src()
--------pom.xml(1001B)
----AUTHORS(517B)
----standardize()
--------src()
--------pom.xml(2KB)
----LICENSE(10KB)
----tools()
--------src()
--------pom.xml(993B)
----README.md(5KB)
----pom.xml(1KB)
----.gitignore(45B)