【文件属性】:
文件名称:DataProductCoursera:为 Cousera 开发数据产品课程开发的闪亮应用程序
文件大小:7KB
文件格式:ZIP
更新时间:2021-06-28 22:21:23
R
标题
作者
日期
输出
运行
URL 文本分析 - 文档
达尼洛·斯科佐尼·雷
2015 年 1 月 25 日,星期日
html_document
闪亮的
介绍
URL 文本分析应用程序是一个非常简单的应用程序,它获取指定 URL 的 HTML 代码,处理标签内的文本并向用户绘制 wordcloud。 在后台,应用程序使用tm包处理文本并将其转换为文档和单词,并使用wordcloud包绘制wordcloud。
更详细的解释如下:
细节
HTML 抓取和处理
应用程序在用户定义的 URL 中启动。 以下代码下载 HTML 代码并使用XML包进行处理,以使用XPATH获取标签:
# Getting and parsing the HTML
html = getURL( input $ url )
doc.html = htmlTreeParse( html
【文件预览】:
DataProductCoursera-master
----.gitignore(574B)
----AppSlides.Rmd(3KB)
----server.R(2KB)
----README.md(2KB)
----README.Rmd(2KB)
----.gitattributes(378B)
----ui.R(2KB)