文件名称:name-dataset:可能是全球最大的名称数据集
文件大小:30.37MB
文件格式:ZIP
更新时间:2024-06-03 04:36:22
Shell
姓氏和名字数据集 当您有一个名称并且想要检查它是否看起来像合法名称时,此模块很有用。 如果您有全文本,并且想要查找名称的位置,则最好使用。 作品: v1:16万个名字,10万个姓氏-来自IMDB,从互联网上抓取的名称数据库。 v2:160万个姓氏,350万个姓氏-来自 。 安装 聚酰亚胺 pip install names-dataset 用法 安装完成后,运行以下命令以熟悉该库: from names_dataset import NameDataset from names_dataset import NameDatasetV1 # v2 m = NameDataset () # init it only once in your app because the V2 takes much more time to init than the V1. print ( m
【文件预览】:
name-dataset-master
----setup.py(561B)
----.gitignore(1KB)
----LICENSE(11KB)
----.github()
--------FUNDING.yml(23B)
--------workflows()
----README.md(5KB)
----tests()
--------test_unit.py(3KB)
----eng_dictionary()
--------1000-no-names.txt(6KB)
--------names-from-forbes-wp_users.txt(14KB)
--------google-10000-english-no-names.txt(71KB)
----main.py(722B)
----misc()
--------img_1.png(38KB)
--------img_2.png(476KB)
----generation()
--------generate_v2.sh(1KB)
--------diff_v2.py(746B)
--------load_and_compile_lib.sh(288B)
--------diff.py(629B)
--------scripts()
--------generate.sh(10KB)
----names_dataset()
--------nd_v2.py(1KB)
--------__init__.py(106B)
--------v1()
--------nd_v1.py(1018B)
--------v2()
----tox.ini(199B)