首先昨天讲的内容有
类型转换
1:数字类型: int () bool() float()
2:str 与int: int('10') | int('-10') | int('0') | float('-.5') | float('3.14') | str(数字)
3:重点 -str 与list
’abc‘ => ['a','b','c'] : list('abc') 转回去 ''.join([a,b,c,])
s.split(" ") :'abc|def|xyz' => ['abc', 'def', 'xyz']
4:list set tuple 类型() 无缝转换
5:list与dict
必须是列表里面[('a', 1), ('b', 2), ('c', 3)] 才可以{'a': 1, 'b': 2, 'c': 3}
for k,v in [('a', 1), ('b', 2), ('c', 3)]
dic[k] = v
6:可以通过字典构建任意数据的映射关系
type_map = {
1: '壹',
'壹': 1,
'owen':(1, 88888),
'add': add # add是功能(函数)
}
然后是字符编码,
编码表 人能识别的符号与机器能识别的符号 的映射关系
py2里面 默认 是ascii码
py3里面默认是utf8
utf8是unicode 的一种实现方式 采用变长存储数据,字母数字简单符号是一个字节,中文是3-6个字节 才英文数字多的时候更节省储存空间,用于传输,cpu与硬盘采用的编码格式
utf-16 采用定长存储数据 英文和汉字都是采用2个字节,读取效率高 内存中采用的编码格式
gbk => ust 8 : 过程 转码
普通字符串=》二进制字符串 编码 是为了传输数据,
二进制字符串 =》普通字符串:解码,母的是用于显示数据,
今天的内容 文件的操作
三种字符串
#普通字符串,用于显示 ---------以u字符作为输出单位 默认的都是这种
print(u'abc') # 用于显示
#二进制字符串 是用于传输 以b字符作为输出单位
print(b'abc')
# 原义字符串 以r字符作为输出单位,所有普通字符串中能被转义的符号在这里都原样输出
print(r'a\tb\nc') # 取消转义
文件操作的三步骤
1:先打开文件:硬盘空间被操作系统持有,文件对象被应用程序持有
f. open ('文件名','操作文件的模式 ',‘’编码格式‘’)
2操作文件
data = f.read()
3释放文件: 释放操作系统对硬盘空间的持有
f.close()
然后是读模式
f = open('source.txt', 'r', encoding='utf-8')
f.read() # 将所有内容一次性读完
f.read(10) # 读取指定字符数
f.readline() # 一次读取一行(文件的换行标识就是结束本次读取的依据)
f.readlines() # 将所有内容读存,按换行标识作为读取一次的依据,存放为列表
f.close()
然后是写模式
wf = open ('文件名',‘w’,encoding=‘utf-8’)
wf.write('写入的内容') 一次一条,想换行必须要自己用\n标识
wf.flush() 想操作系统发送一个将内存中写入的数据刷新到硬盘里
wf.writelines([]) 一次写多行,行必须用\n标识,
然后 wf.close 将内存中写入的数据刷新到硬盘,并且释放硬盘空间
with...open语法
优化整合文件的打开与释放 后面可以跟个 as 起个别名
在with下缩进里面可以操作文件对象,一旦取消缩进,资源就被释放
with open()open里面和正常操作文件一样
with open('target.txt', 'r', encoding='utf-8') as rf1, open('target1.txt', 'r', encoding='utf-8') as rf2:
print(rf1.read())
print(rf2.read())
可以在后面逗号 再open一个文件 两个文件都可以在缩进内部操作
with open('target.txt', 'r', encoding='utf-8') as rf1:
with open('target1.txt', 'r', encoding='utf-8') as rf2:
print(rf1.read())
print(rf2.read())
# print(rf1.read()) # 可以操作
# print(rf2.read()) # 不可以操作
文件的集中操作模式,
主模式 有四种 r w a x
从模式 有 t b +
r: 读,必须有
w: 清空写,可有可无
a: 追加写,可有可无
x:创建写,必须无
从模式就是跟在主模式后面 给主模式加个功能
t:默认,按字符操作
b:按字节操作
+:可读可写
r+ 模式 可以写 默认是从头开始替换写
a+模式,是替换了写
文件操作编码的一些问题
t模式下 源文件 采用什么编码 ,就选什么编码,如果不选,默认就是系统的默认的操作编码格式
t模式下 要指定编码
b模式下 硬盘就是二进制存放 且能根据内容识别出编码,写入时也是通过某种编码格式处理好的 所以在操作时 没有必要再去规定编码
文件的复制
可以打开两个文件, 一个读模式,然后把读到的所有内容都写到另一个文件里
# 文本文件的复制:可以t也可以b
with open('target.txt', 'r', encoding='utf-8') as rf:
with open('target2.txt', 'w', encoding='utf-8') as wf:
for line in rf:
wf.write(line)
with open('target.txt', 'rb') as rf:
with open('target3.txt', 'wb') as wf:
for line in rf:
wf.write(line)
# 非文本文件只能采用b模式操作,不需要指定编码 - 因为根本不涉及编码解码过程
with open('001.mp4', 'rb') as rf:
with open('002.mp4', 'wb') as wf:
for line in rf:
wf.write(line)
游标操作
1:游标操作的是字节,所以只能在b模式下进行操作
2:操作游标 可以改变操作位置,r模式下可以改变位置进行操作。所以主模式选择r模式
3:操作方法 是 文件对象.seek(offset , whence)
-- offset 为正数就是向后便宜多少个字节,负数就是向前偏移多少个字节
--后面的whence 0代表将游标置为开头 1代表从当前位置,2代表将游标置为末尾
# 你是日本人
with open('target.txt', 'rb') as f:
# 先读6个字节
data = f.read(6)
print(data.decode('utf-8')) # 你是
# 将游标从头开始往后偏移3个字节
f.seek(3, 0)
data = f.read(6)
print(data.decode('utf-8')) # 是日
# 从当前游标位置往前偏移3个字节
f.seek(-3, 1)
data = f.read(3)
print(data.decode('utf-8')) # 日
f.seek(-3, 2)
data = f.read(3)
print(data.decode('utf-8')) # 人