文件名称:MiniTimeMK:新闻聚合器和分类器系统
文件大小:3.74MB
文件格式:ZIP
更新时间:2024-06-27 00:45:10
Python
迷你时间.mk 一个新闻聚合网站 概括 该应用程序的目的是收集和处理来自不同来源的具有给定类别的新闻文章,对新闻文章执行分层凝聚聚类,为每个集群找到最相关的类别并根据集群中的不同来源对它们进行排名和文章的发布时间。 该应用程序使用 MySQL 数据库来存储数据,使用 Web2py 框架来处理数据库、处理请求和调度更新功能。 学分 该应用程序由以下人员开发: 在以下老师的指导下: 基准 该应用程序针对性能进行了优化,这些是测量的时间: 19125 毫秒内处理了 3050 个帖子 在 22460 毫秒内插入数据库的帖子 tf-idf 在 1135 毫秒内完成 HAC 在 1076 毫秒内完成 生成静态页面:3562 毫秒 设置说明: 安装 Python v2.7.* 32 位 安装以下 Python 包: 查询 速度解析器 pywin32(如果您使用的是 Windows) urlli