Python中StringIO和BytesIO

时间:2022-08-04 20:34:27

介绍一下Python在内存中读写数据,用到的模块是StringIO和BytesIO

StringIO

>>> from io import StringIO
>>> f = StringIO()
>>> f.write('hello')
5
>>> f.write(' ')
1
>>> f.write('world!')
6
>>> print(f.getvalue())
hello world!

getvalue()方法用于获得写入后的str。

要读取StringIO,可以用一个str初始化StringIO,然后,像读文件一样读取:

>>> from io import StringIO
>>> f = StringIO('Hello!\nHi!\nGoodbye!')
>>> while True:
... s = f.readline()
... if s == '':
... break
... print(s.strip())
...
Hello!
Hi!
Goodbye!

BytesIO

StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。

BytesIO实现了在内存中读写bytes,我们创建一个BytesIO,然后写入一些bytes:

>>> from io import BytesIO
>>> f = BytesIO()
>>> f.write('中文'.encode('utf-8'))
6
>>> print(f.getvalue())
b'\xe4\xb8\xad\xe6\x96\x87'

请注意,写入的不是str,而是经过UTF-8编码的bytes。

和StringIO类似,可以用一个bytes初始化BytesIO,然后,像读文件一样读取:

>>> from io import BytesIO
>>> f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
>>> f.read()
b'\xe4\xb8\xad\xe6\x96\x87'

总结

# stringIO 比如说,这时候,你需要对获取到的数据进行操作,但是你并不想把数据写到本地硬盘上,这时候你就可以用stringIO
>>> from io import StringIO
>>> from io import BytesIO
>>> def outputstring():
return 'string \nfrom \noutputstring \nfunction' >>> s = outputstring()
# 将函数返回的数据在内存中读
>>> sio = StringIO(s)
# 可以用StringIO本身的方法
>>> print(sio.getvalue())
string
from
outputstring
function
# 也可以用file-like object的方法
>>> s= sio.readlines()
>>> for i in s:
print(i.strip()) >>>string
from
outputstring
function
# 将函数返回的数据在内存中写
>>> sio = StringIO()
>>> sio.write(s)
36
# 可以用StringIO本身的方法查看
>>> s = sio.getvalue()
>>> print(s)
string
from
outputstring
function
# 如果你用file-like object的方法查看的时候,你会发现数据为空
>>> sio = StringIO()
>>> sio.write(s)
36
>>> for i in sio.readlines():
print(i.strip()) >>>
# 这时候我们需要修改下文件的指针位置
# 我们发现可以打印出内容了
>>> sio = StringIO()
>>> sio.write(s)
36
>>> sio.seek(0,0)
0
>>> print(sio.tell())
0
>>> for i in sio.readlines():
print(i.strip()) string
from
outputstring
function
# 这就涉及到了两个方法seek 和 tell
# tell 方法获取当前文件读取指针的位置
# seek 方法,用于移动文件读写指针到指定位置,有两个参数,第一个offset: 偏移量,需要向前或向后的字节数,正为向后,负为向前;第二个whence: 可选值,默认为0,表示文件开头,1表示相对于当前的位置,2表示文件末尾
# 用seek方法时,需注意,如果你打开的文件没有用'b'的方式打开,则offset无法使用负值哦
# stringIO 只能操作str,如果要操作二进制数据,就需要用到BytesIO
# 上面的sio无法用seek从当前位置向前移动,这时候,我们用'b'的方式写入数据,就可以向前移动了
>>> bio = BytesIO()
>>> bio.write(s.encode('utf-8'))
36
>>> print(bio.getvalue())
b'string \nfrom \noutputstring \nfunction'
>>> bio.seek(-36,1)
0
>>> print(bio.tell())
0
>>> for i in bio.readlines():
  print(i.strip()) b'string'
b'from'
b'outputstring'
b'function'

引自廖雪峰Python教程