文件名称:fuzzyjoin:在不完全匹配的情况下将表连接在一起
文件大小:363KB
文件格式:ZIP
更新时间:2024-05-28 01:49:49
R
Fuzzyjoin:在不完全匹配的情况下联接数据帧 Fuzzyjoin程序包是dplyr的join操作的变体,它不仅允许匹配列之间匹配的值,还可以匹配不精确的匹配。 这样就可以匹配: 在一定公差范围内的数值( difference_inner_join ) Levenshtein / cosine / Jaccard距离或包中的相似的字符串( stringdist_inner_join ) 一列中的正则表达式与另一列中的正则表达式( regex_inner_join ) 跨多个列的欧几里得距离或曼哈顿距离( distance_inner_join ) 基于经度和纬度的地理距离( geo_inner_join ) 与( interval_inner_join )重叠的(开始,结束) interval_inner_join 基因组间隔(包括染色体ID和(开始,结束)对)重叠(
【文件预览】:
fuzzyjoin-master
----.travis.yml(387B)
----fuzzyjoin.Rproj(395B)
----docs()
--------news()
--------bootstrap-toc.css(2KB)
--------articles()
--------bootstrap-toc.js(5KB)
--------docsearch.css(11KB)
--------404.html(5KB)
--------pkgdown.css(7KB)
--------index.html(44KB)
--------authors.html(5KB)
--------link.svg(810B)
--------pkgdown.yml(128B)
--------reference()
--------LICENSE-text.html(5KB)
--------docsearch.js(2KB)
--------pkgdown.js(3KB)
--------CONDUCT.html(7KB)
----README.Rmd(11KB)
----man()
--------interval_join.Rd(2KB)
--------regex_join.Rd(1KB)
--------genome_join.Rd(3KB)
--------stringdist_join.Rd(2KB)
--------geo_join.Rd(3KB)
--------distance_join.Rd(2KB)
--------misspellings.Rd(1KB)
--------difference_join.Rd(2KB)
--------fuzzy_join.Rd(2KB)
----tools()
--------README-character_passages_matrix-1.png(30KB)
----data()
--------misspellings.rda(34KB)
----NAMESPACE(2KB)
----NEWS.md(2KB)
----CONDUCT.md(1KB)
----tests()
--------testthat()
--------testthat.R(62B)
----LICENSE(44B)
----cran-comments.md(333B)
----appveyor.yml(913B)
----vignettes()
--------stringdist_join.Rmd(4KB)
----.Rbuildignore(174B)
----.gitignore(45B)
----R()
--------fuzzy_join.R(10KB)
--------distance_join.R(4KB)
--------geo_join.R(6KB)
--------global.R(90B)
--------genome_join.R(4KB)
--------difference_join.R(2KB)
--------interval_join.R(4KB)
--------regex_join.R(2KB)
--------misspellings.R(1KB)
--------utils.R(1007B)
--------stringdist_join.R(4KB)
----DESCRIPTION(1KB)
----README.md(20KB)