古腾堡:从古腾堡计划中搜索和下载公共领域文本

时间:2024-02-26 08:41:02
【文件属性】:

文件名称:古腾堡:从古腾堡计划中搜索和下载公共领域文本

文件大小:9.38MB

文件格式:ZIP

更新时间:2024-02-26 08:41:02

r rstats r-package peer-reviewed RR

输出 github_document gutenbergr:R包,用于从Gutenberg项目中搜索和下载公共领域的文本 作者:执照: 从收藏中下载和处理公共领域的作品。 包括 一个功能gutenberg_download()通过ID gutenberg_download(84)腾堡计划中下载一个或多个作品:例如, gutenberg_download(84)下载科学怪人的文本。 所有Gutenberg项目的元数据都用作R数据集,因此可以对其进行搜索和过滤: gutenberg_metadata包含有关每个作品的信息,将古腾堡ID与标题,作者,语言等配对 gutenberg_author


【文件预览】:
gutenbergr-master
----.gitignore(47B)
----NAMESPACE(164B)
----NEWS.md(3KB)
----vignettes()
--------intro.Rmd(6KB)
----data-raw()
--------metadata.json.gz(6.36MB)
--------ids_with_text.txt(287KB)
--------text_files.sh(345B)
--------README.md(1KB)
--------book_metadata.R(3KB)
--------gitenberg_meta.py(930B)
----R()
--------data.R(5KB)
--------globals.R(173B)
--------gutenberg_download.R(8KB)
--------gutenberg_works.R(4KB)
--------utils.R(1KB)
----data()
--------gutenberg_metadata.rda(1.15MB)
--------gutenberg_authors.rda(339KB)
--------gutenberg_subjects.rda(527KB)
----.Rbuildignore(149B)
----gutenbergr.Rproj(395B)
----.travis.yml(191B)
----man()
--------gutenberg_works.Rd(3KB)
--------gutenberg_strip.Rd(829B)
--------gutenberg_subjects.Rd(2KB)
--------gutenberg_get_mirror.Rd(588B)
--------gutenberg_metadata.Rd(3KB)
--------read_zip_url.Rd(291B)
--------gutenberg_download.Rd(3KB)
--------gutenberg_authors.Rd(1KB)
----README.md(13KB)
----CONDUCT.md(1KB)
----tests()
--------testthat.R(64B)
--------testthat()
----inst()
--------extdata()
----README.Rmd(7KB)
----appveyor.yml(836B)
----cran-comments.md(890B)
----DESCRIPTION(942B)

网友评论