【文件属性】:
文件名称:My_NodeJS_Crawler:My_NodeJS_Crawler,第一个爬虫演示
文件大小:1.55MB
文件格式:ZIP
更新时间:2021-07-05 20:46:51
JavaScript
项目名称:tufencrawler(土粉网爬虫程序)
mysql数据库名称:tufen_crawler
CREATE SCHEMA tufen_crawler
CREATE TABLE tufen_crawler.topic (
id INT NOT NULL,
author VARCHAR(45) NULL,
date VARCHAR(45) NULL,
content VARCHAR(45) NULL,
PRIMARY KEY (id));
原始网页地址:
正则表达式匹配规则:
var url = ''
var s = url.match(/post-enterprise-(\d+)-(\d).shtml/)
console.log(s[2]);
var content = $('.atl-content bbs-content').html().trim();
主要思路:
提取内容,