文件名称:fingerprint:用PHP实现指纹
文件大小:12KB
文件格式:ZIP
更新时间:2024-05-31 18:41:10
PHP
指纹 是Google Refine(后来的OpenRefine)开发的一种算法。 对原始算法的(可选)改进以粗体显示。 删除前导和尾随空格 将所有字符更改为小写形式 删除所有标点和控制字符 将扩展的西方字符归一化为其ASCII表示形式(例如“gödel”→“ godel”) 应用同义词 应用清除 将字符串分成空格分隔的标记 排序令牌并删除重复项 将令牌重新结合在一起 音译是原始算法中最慢的部分,如果您主要使用英语,那会浪费时间。 原始算法具有局限性,因为它会丢失所有同义词和删除内容。 同义词和删除是基于英语的,因此它只能使用英语以外的其他语言来使用设备。 考虑如下标题: 销售和营销副总裁 市场与销售副总裁 销售和营销副总裁 副总裁-销售和市场推广...(按字面意思,还有100种以上的书写方式) 用例 简单快速的数据集群。 对数据库中的相似值进行标准化和分组。 在这种情况下,用户以
【文件预览】:
fingerprint-master
----composer.json(635B)
----.travis.yml(167B)
----tests()
--------FingerprintTest.php(6KB)
----src()
--------Vladanme()
----LICENSE.md(1KB)
----.gitignore(16B)
----phpunit.xml.dist(676B)
----README.md(4KB)