文件名称:levitate:R中的模糊字符串匹配。受Python的Fuzzywuzzy启发(但没有Python)
文件大小:42KB
文件格式:ZIP
更新时间:2024-04-30 12:08:41
r fuzzy-matching similarity-measures fuzzywuzzy string-similarity
R的模糊字符串匹配 levitate是基于Python 包模糊字符串匹配。 这方面的一个R气口已经存在,但不像 , levitate写入完全在R 2与上没有外部的依赖reticulate或Python。 它还以矢量化功能的形式提供了一些额外的功能。 在查看文档。 为什么要“ levitate ”? 字符串相似性的一种常见度量是 ,该名称在CRAN上可用。 例子 lev_distance() 编辑距离是将一个字符串转换为另一个字符串所需的加,减或替代的数量。 Base R提供了adist()函数来进行计算。 levitate提供lev_distance()这是由供电包。 lev_distance( " cat " , " bat " ) # > [1] 1 lev_distance( " rat " , " rats " ) # > [1] 1 lev_distance( " ca
【文件预览】:
levitate-main
----.gitignore(64B)
----NAMESPACE(168B)
----NEWS.md(34B)
----vignettes()
--------.gitignore(11B)
--------levitate.Rmd(3KB)
----data-raw()
--------hotel_rooms.R(250B)
----R()
--------hotel_rooms.R(483B)
--------lev-distance.R(13KB)
--------string-utils.R(3KB)
----data()
--------hotel_rooms.rda(2KB)
----.Rbuildignore(149B)
----LICENSE.md(34KB)
----.travis.yml(631B)
----LICENSE(48B)
----_pkgdown.yml(796B)
----man()
--------lev_ratio.Rd(2KB)
--------lev_token_sort_ratio.Rd(1KB)
--------lev_distance.Rd(2KB)
--------lev_token_set_ratio.Rd(2KB)
--------str_token_sort.Rd(855B)
--------lev_partial_ratio.Rd(1KB)
--------str_all_substrings.Rd(843B)
--------str_tokenise.Rd(947B)
--------default-params.Rd(966B)
--------internal-functions.Rd(2KB)
--------lev_simplify_matrix.Rd(654B)
--------hotel_rooms.Rd(604B)
----README.md(5KB)
----tests()
--------testthat.R(60B)
--------testthat()
----inst()
--------extdata()
----README.Rmd(5KB)
----cran-comments.md(264B)
----levitate.Rproj(333B)
----DESCRIPTION(732B)