文件名称:360giving-data-visualization:一等奖-授予主题的360Giving主题建模和数据可视化
文件大小:2.17MB
文件格式:ZIP
更新时间:2024-05-17 17:03:08
JavaScript
360提供数据可视化 为赠款主题提供360Giving主题建模和数据可视化 360捐赠 360giving数据可视化挑战赛的主题建模和数据可视化 分析使用的代码可在具有Creative Commons 4.0许可证的获得。 此分析的数据集是一个数据转储,其中包含360Giving标准中发布的所有资助 该分析通过使用无监督的文本挖掘方法来执行主题建模。 数据集的某些字段用作“文本文档”,以提取一组k个主题,每个主题均由该主题的一组最具代表性(排名最高)的术语以及与该主题相关的文档的关联(权重)来表示话题。 通过删除停用词以及数据中存在但与描述主题无关的一组自定义词来对数据进行预处理。 主题的数量和主题的术语数量不是固定的。 为了进行分析,设置了15个主题和每个主题20个字词。 对于主题建模,已使用非负矩阵分解(NMF)算法。 该方法的输出结果是对所有主题具有代表性的权重,而对所有主题均具有