文件名称:jitaba-crawler:爬虫根据请求,cheerio,操纵up
文件大小:6KB
文件格式:ZIP
更新时间:2024-05-02 04:18:21
JavaScript
吉他谱网站逻辑 let score = { title: '', name: '', keys: '', singer: '', poster: '', tags: '', rating: '', views: '', spectrum: '', description: '' } 首先爬取列表页的url 进入详情页,爬取 title 根据标题得到 name singer keys 根据 $('#tabzone') 里面有无文字来判断是否用简介得到 description , 若没有则爬取豆瓣的简介 将所有$('#tabzone')里面的所有 img 元素 作为 spectrum曲谱,把第一张作为 **poster ** 海报地址,再爬取豆瓣页的海报,若有则替换 豆瓣页
【文件预览】:
jitaba-crawler-master
----request.js(583B)
----index.js(702B)
----Readme.md(701B)
----douban.js(5KB)
----jitaba.js(2KB)
----handle.js(4KB)