文件名称:python实现简单爬虫的资料说明
文件大小:338KB
文件格式:DOC
更新时间:2024-07-27 06:27:22
python爬虫
一 正则表达式 正则表达式是一个很强大的工具了,众多的语法规则,我在爬虫中常用的有: . 匹配任意字符(换行符除外) * 匹配前一个字符0或无限次 ? 匹配前一个字符0或1次 .* 贪心算法 .*? 非贪心算法 (.*?) 将匹配到的括号中的结果输出 \d 匹配数字 re.S 使得.可以匹配换行符 常用的方法有:find_all(),search(),sub()