IO也算是python标准库比较常见的了。
平时光用,但没有好好的去理解它。

运行环境 Runtime environment

1
2
3
操作系统: Windos10  
IDE: JetBrains Pycharm 2019.2.4 x64
语言: Python 3.7.4

io流(io stream)

1
2
3
4
5
6
7
8
9
10
11
    流是一种抽象概念,它代表了数据的无结构化传递。

按照流的方式进行输入输出,数据被当成无结构的字节序或字符序列。
从流中取得数据的操作称为提取操作,而向流中添加数据的操作称为插入操作。
用来进行输入输出操作的流就称为IO流。
换句话说,IO流就是以流的方式进行输入输出。

输入输出(IO)是指计算机同任何外部设备之间的数据传递。
常见的输入输出设备有文件、键盘、打印机、屏幕等。
数据可以按记录(或称数据块)的方式传递,也可以流的方式传递。
所谓记录,是指有着内部结构的数据块。记录内部除了有需要处理的实际数据之外,还可能包含附加信息,这些附加信息通常是对本记录数据的描述。

StringIO

很多时候,数据读写不一定是文件,也可以在内存中读写。

StringIO顾名思义就是在内存中读写str,也是最常见的一种用法。

要把str写入StringIO,我们需要先创建一个StringIO,然后,像文件一样写入即可:

1
2
3
4
5
6
from io import StringIO
f = StringIO()
f.write('hello') # 返回 5,也即写入的字符数目
f.write(' ')
f.write('world!')
f.getvalue() # hello world!

还可以做读取操作,跟文件open读取方法类似

1
2
3
4
5
6
f = StringIO('Hello!\nWorld!')
while True:
line = f.readline()
if line == '':
break
print(line.strip())

BytesIO

StringIO操作的只能是str,如果要操作二进制数据,就需要使用BytesIO。

BytesIO实现了在内存中读写bytes,我们创建一个BytesIO,然后写入一些bytes:

1
2
3
4
5
6
from io import BytesIO
f = BytesIO()
f.write('中文'.encode('utf-8'))
print(f.getvalue())
运行结果:
b'\xe4\xb8\xad\xe6\x96\x87'

写入的不是str,而是经过UTF-8编码的bytes。

和StringIO类似,可以用一个bytes初始化BytesIO,然后,像读文件一样读取:

1
2
3
4
5
from io import BytesIO
f = BytesIO(b'\xe4\xb8\xad\xe6\x96\x87')
f.read()
运行结果:
b'\xe4\xb8\xad\xe6\x96\x87'

总结

StringIO和BytesIO是在内存中操作str和bytes的方法,使得和读写文件具有一致的接口。