文件名称:hmni:Name模糊名称匹配与机器学习
文件大小:21.26MB
文件格式:ZIP
更新时间:2024-05-20 13:14:11
python nlp data-science machine-learning natural-language-processing
HMNI 模糊名称与机器学习匹配。 执行常见的模糊名称匹配任务,包括相似性评分,记录链接,重复数据删除和规范化。 HMNI接受了国际音译的拉丁名字数据集的培训,其中优先考虑精度。 模型 准确性 精确 记起 F1-分数 HMNI-拉丁 0.9393 0.9255 0.7548 0.8315 有关HMNI背后的方法和研究的简介,请参阅我的。 要求 Python 3.5–3.8 张量流 scikit学习 模糊的 深渊 统一编码 快速使用指南 安装 通过PyPI使用PIP pip install hmni 初始化匹配器对象 import hmni matcher = hmni . Matcher ( model = 'latin' ) 单对相似 matcher . similarity ( 'Alan' , 'Al' ) # 0.6838303319889133 matcher
【文件预览】:
hmni-master
----MANIFEST.in(21B)
----nametag.png(7KB)
----.gitattributes(33B)
----requirements.txt(101B)
----LICENSE(1KB)
----setup.py(1KB)
----README.md(7KB)
----hmni()
--------models()
--------input_helpers.py(5KB)
--------__init__.py(679B)
--------siamese_network.py(6KB)
--------syllable_tokenizer.py(2KB)
--------preprocess.py(10KB)
--------matcher.py(18KB)
----tests()
--------test_matcher_params.py(6KB)
--------test_matcher.py(1KB)
----dev()
--------model_building.ipynb(96KB)
--------name_pairs.txt(241KB)