名义上:用于记录链接的最大强度名称解析器

时间:2024-02-23 17:42:48
【文件属性】:

文件名称:名义上:用于记录链接的最大强度名称解析器

文件大小:97KB

文件格式:ZIP

更新时间:2024-02-23 17:42:48

parser data-science parsing record-linkage entity-resolution

名义上:用于记录链接的最大强度名称解析器 :link: 名字 名义上将以书写的个人名字简化并解析为六个核心字段:标题,,中间名,姓氏,后缀和昵称。 通常,名义上用于解析整个列表或名称。 该软件包包括一个命令行工具,用于解析单个名称,以便进行一次性测试和示例。 名义上产生的字段主要适合在数据集中或数据集中进行比较。 这样一来,名字的格式就不用考虑人的句法偏好了: de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g Mr. Johann G. de von Ausfern de von ausfern, mr johann g而不是Mr. Johann G. de von Ausfern 。 :notebook: 入门 调用parse_name()解析六个核心字段: $ python -q >>> from nominally import parse_name >>> parse_name("Blankinsop, Jr., Mr. James 'Jimmy'"


【文件预览】:
nominally-master
----setup.py(273B)
----pylintrc(10KB)
----.gitignore(552B)
----requirements.txt(27B)
----MANIFEST.in(40B)
----CONTRIBUTING.md(829B)
----CODE_OF_CONDUCT.md(3KB)
----LICENSE(34KB)
----setup.cfg(2KB)
----noxfile.py(7KB)
----stubs()
--------unidecode()
----nominally()
--------utilities.py(486B)
--------__init__.py(169B)
--------parser.py(15KB)
--------api.py(2KB)
--------config.py(2KB)
--------__main__.py(37B)
----README.md(6KB)
----.circleci()
--------config.yml(978B)
----requirements()
--------dev.txt(242B)
--------common.txt(15B)
--------test.txt(143B)
--------docs.txt(188B)
----docs()
--------sausage.rst(396B)
--------use.rst(2KB)
--------_templates()
--------index.rst(3KB)
--------conf.py(3KB)
--------_static()
--------about.rst(2KB)
--------faq.rst(2KB)
----test()
--------pylintrc(1KB)
--------test_prefix_conjunction.py(6KB)
--------conftest.py(841B)
--------test_parse_ordering.py(1KB)
--------test_suffix_and_title.py(7KB)
--------test_utilities.py(2KB)
--------test_name_core.py(5KB)
--------names()
--------__init__.py(0B)
--------test_api.py(2KB)
--------test__issues.py(269B)
--------test_unbreakable.py(2KB)
--------test_name_blasting.py(772B)
--------test_cleaning.py(3KB)

网友评论