在线词频统计工具

时间:2024-02-20 21:08:27

在线词频统计工具

词频统计的意义

词频统计分析:是文本挖掘的重要方法,通过关键词出现频次多少的变化,来确定热点及其变化趋势

不管你是在工作还是生活中,都会有词频统计的需求

比如:我最近迷上了周杰伦的歌,我想分析周杰伦的歌曲的高频词

词频统计 词频分析 词频可视化 分词


比如:我要做关于淘宝国产手机评论分析,了解下大家都主要说了哪些总要的信息,并帮助商家如何提升产品质量和业绩

词频统计 词频分析 词频可视化 分词

比如:我在*机构上班,需要对每次行业报告做词频挖掘分析,了解本次报告重点出现的关键词与以往的报告做对比
词频统计 词频分析 词频可视化 分词


甚至不少大学生也会应用到词频统计工具,帮助他写论文报告、帮助他快速了解一本书的中心思想等等
词频统计 词频分析 词频可视化 分词

此处使用一款国内非常良心的词频统计分析工具“微词云.强大的文字云艺术生成器”,你不需要懂任何代码程序,只要把文本内容复制导入到“微词云”中就可以完成词频统计了。

词频统计 词频分析 词频可视化 分词


微词云词频统计功能特点

  • 支持千万大文本分词量:最高上传文本量20M
  • 自定义词典功能:关心词一个都不拉,分析更精准
  • 提供多纬度筛词:过滤未知词、单个词、词频为1的词、根据不同词性进行过滤词
  • 词频统计下载:支持下载全部的分词词频统计结果
  • 支持词云图可视化:可以在这里做出非常漂亮的词云图哦



词频统计分析案例

我以384首的周杰伦歌词析案例进行分享微词云如何实现词频统计的

先进入微词云(weiciyun.com)的首页:点击【创建词云】


tep1:
点击【导入单词】,把文本输入到【分词筛词后导入】中

把周杰伦的歌词文本复制粘贴到文本框中,点击【开始分词】
4.png[词频统计 词频分析 自定义词典 分词


tep2:
进入到词性筛词界面,先通过【词性】进行筛选不需要的词(不需要的词,就取消勾选就可以了)

筛选完词后,点击右下角的【确定使用所选单词】以上就完成了基本的文本分词词频统计的功能

词频统计 词频分析 词频可视化 分词

【GIF操作视频】

词频统计 词频分析 词频可视化 分词

【词频中的高级功能】

自定义词典:
希望分词更精准(例如手感好,系统被分成“手感和好”了)建议在分词页使用【自定义词典】功能;把不想被分开的关键词输入到自定义词典中就可以了;使用自定义词典功能
[词频统计 词频分析 自定义词典 分词

位置:自定义词典功能:在单词导入的右上角上


我们来看下周杰伦歌词的top前20词频可视化

词频统计 词频分析 词频可视化 分词


top10词频数:
词频统计 词频分析 词频可视化 分词

通过词频可视化可以看出,周杰伦的哥很悲伤,“回忆”“离开”充满着孤单的情感。主要偏爱情的歌曲比较多


### 【重点功能:保存草稿】

词频统计 词频分析 词频可视化 分词


可以根据筛词后的数据做出不同形状的词频可视化词云图,微词云还支持”python颜色组
词频统计 词频分析 词频可视化 分词
词频统计 词频分析 词频可视化 分词

在配置中的颜色组中可以找到


对文本的关键词进行细致分析,例如周杰伦歌词中的情感词,可以手动返回到到筛词页进行在次筛词下

词频统计 词频分析 词频可视化 分词

点击【单词导入】即可进入到筛词页


词频统计 词频分析 词频筛词 分词

[词词频统计 词频分析 词频可视化 分词

周杰伦的情感中,被“爱情,妈妈,眼泪,安静和思念”笼罩着,情感比较丰富




最后

未来微词云还会继续优化更多的数据分析功能。以上也我也只是用到其中的一部分功能而已,希望对大家做数据分析有帮助。