文件名称:My_NodeJS_Crawler:My_NodeJS_Crawler,第一个爬虫演示
文件大小:1.55MB
文件格式:ZIP
更新时间:2024-07-25 14:33:31
JavaScript
项目名称:tufencrawler(土粉网爬虫程序) mysql数据库名称:tufen_crawler CREATE SCHEMA tufen_crawler CREATE TABLE tufen_crawler.topic ( id INT NOT NULL, author VARCHAR(45) NULL, date VARCHAR(45) NULL, content VARCHAR(45) NULL, PRIMARY KEY (id)); 原始网页地址: 正则表达式匹配规则: var url = '' var s = url.match(/post-enterprise-(\d+)-(\d).shtml/) console.log(s[2]); var content = $('.atl-content bbs-content').html().trim(); 主要思路: 提取内容,