1. 正则表达式 匹配字符串
元字符
. 除了换行
\w 数字, 字母, 下划线
\d 数字
\s 空白符
\n 换行符
\t 制表符
\b 单词的边界
\W \D \S 非xxx
[] 字符组
^ 字符串的开始
$ 字符串的结束
| 或者
量词
* 重复0->n次
+ 重复1->n次
? 重复0->1次
{p} 重复p次
{p,q} 重复p->q次
{p,} 重复至少p次
贪婪和惰性
贪婪: .* .+
惰性: .*? 尽可能少的匹配
转义 \\\\n => \\n => \n 正则前面加r
分组 ()
2. 在python中使用正则. re模块
1. search() 搜索. 搜索到第一个结果返回
2. match() 匹配. 收到一个结果返回. 从头开始匹配
3. findall() 查找所有匹配结果
4. finditer() 返回迭代器. (?P<name>正则)
5. compile() 编译
6. group("name") 获取数据
7. re.S 干掉 . 的换行
sub
subn
split
3.模块与包
1. 导入模块的执行的步骤
import
from xxx import xxxx
2. 自定义模块
自己写一个py文件就是一个模块
3. 自定义包
一个表达式 -> 一条语句 -> 语句块 -> 函数 -> 类 -> 模块 -> 包 -> 项目
包就是我们的文件夹, 包内可以写很多个模块
查找路径是:sys.path, 随动. 跟着你的启动文件所在的位置变化
不论使用绝对导入. 还是相对导入. 启动文件一定在最外面