文件名称:Python-Name-Parser:猜字符串中的姓氏和名字。 按受欢迎程度或最大字符使用量选择
文件大小:1.12MB
文件格式:ZIP
更新时间:2024-06-19 04:27:35
Python
Python3 名称解析器 从电子邮件地址、用户名等获取姓氏和名字信息 特征 内置 150,000 多个名称及其受欢迎程度排名的词典。 区分姓氏和名字。 姓氏和名字序列检测:可以检测姓氏序列的无效组合并选择最佳选项。 按受欢迎程度搜索:最适合损坏的字符串。 按最长名称搜索:最适合电子邮件地址或通常有效的数据。 使用 Regex 提取字母序列,将输入分解为单词,大大提高匹配概率。 O(n**2) 的最坏情况运行时不计算上面的单个正则表达式操作(其中 n = 字符数)。 实际扫描时间不到一秒,即使对于具有数百个字符的字符串也是如此。 用法 只需调用 NameParser.Scan()。 输入可以是字符串或字符串列表。
【文件预览】:
Python-Name-Parser-master
----README.rst(907B)
----utils.py(502B)
----nameParser.py(16KB)
----LICENSE(1KB)
----data()
--------last_names.json(2.91MB)
--------first_names.json(89KB)
----.gitignore(702B)