文件名称:基于Python的Web信息获取方法研究_魏冬梅
文件大小:131KB
文件格式:CAJ
更新时间:2021-04-30 07:34:07
Python 信息获取
随着大数据和云计算等新一代互联网技术的迅速发展 ,W eb 信息量逐日海量递增 。 从海量数据中提取有效 信息 , 挖掘有潜在价值的关系成为当前的研究热点 , 这对揭示已知规律 、 预测未知结果有极大的辅助作用 。 对当前 Web 信息获取方法 、 原理和关键技术进行研究分析 , 重点阐述了数据采集相关技术中网络爬虫算法的分类与应用 。 提出一种以 Python和 相关库为主要工具 , 结合模块化方法 , 构建 Web 文本信息获取系统框架与流程的策略 。 案例中 通过定义采集函数 , 实现对给定的*词条 , 快速搜索与该词条相关信息 , 对词条内链接和外链接进行有效爬 取 。 结果表明 ,P ython在 数据采集方面具有较高的有效性和可扩展性 。