文件名称:python爬取新浪,百度,搜狐等网站热点时事新闻.zip
文件大小:9.79MB
文件格式:ZIP
更新时间:2023-09-29 09:24:17
爬虫 python python爬虫
1. 仅下载当天最新、热点的时事新闻; 2. 不同网站的新闻保存在不同文件夹中,并记录每篇新闻的来源、标题、发布时间、下载时间、url地址等信息; 3. 爬虫初始种子: 新浪:news.sina.com.cn 搜狐:news.sohu.com 凤凰:news.ifeng.com 网易:news.163.com 百度:news.baidu.com 4. 主要编程语言为Python