python中提取位图信息(AttributeError: module 'struct' has no attribute 'unstack')

时间:2021-08-07 03:46:29

前言

今天这篇博文有点意思,它是从一个例子出发,从而体现出在编程中的种种细节和一些知识点的运用。和从前一样,我是人,离成神还有几十万里,所以无可避免的出现不严谨的地方甚至错误,请酌情阅读。


0x00

首先,题目是:读取一个位图文件(xxx.bmp),然后读取前30个字节,从这前三十个字节中提取一些信息。

这里有一些知识要先知道:一个位图的前30位有什么?

BMP格式采用小端方式存储数据,文件头的结构按顺序如下:

  • 前两个字节:'BM'表示Windows位图,'BA'表示OS/2位图;
  • 一个4字节整数:表示位图大小;
  • 一个4字节整数:保留位,始终为0;
  • 一个4字节整数:实际图像的偏移量;
  • 一个4字节整数:Header的字节数;
  • 一个4字节整数:图像宽度;
  • 一个4字节整数:图像高度;
  • 一个2字节整数:始终为1;
  • 一个2字节整数:颜色数。

你先要知道,读取一个位图的前30位,那么这前30位是什么编码呢?例如,某个位图的前30位:

 b'\x42\x4d\x38\x8c\x0a\x00\x00\x00\x00\x00\x36\x00\x00\x00\x28\x00\x00\x00\x80\x02\x00\x00\x68\x01\x00\x00\x01\x00\x18\x00'

很容易看出,它们的单位是bytes,也就是说,我们无法直接看懂它们,因此,我们得把它转换成我们能看懂的东西。

**python有趣的地方就在这里了,Python提供了一个struct模块来解决bytes和数据类型的转换。 **

例如,我想把一个整数10241024转换为以bytes为单位的字节怎么办?(如果你不懂字节编码,看这里)很简单:

>>> struct.pack('>I', 10241024)
b'\x00\x9cD\x00'

稍微解释一下:

>表示字节顺序是big-endian,也就是网络序,I表示4字节无符号整数。


那么我想把以bytes为单位的字节转换回整型怎么办?,也很简单:

>>> struct.unpack('>I', b'\x00\x9cD\x00')
(10241024,)

要注意的地方就是unpack函数的第一个参数:'>I',解释和pack函数的一样。


0x01

到了这里,基本可以看例子了。说明:

  1. 我的执行环境是:python 3.6;
  2. data.bmp是我用Windows自带画图随手画的一个位图图片;
  3. 我把这个程序保存为:struct1.py;
  4. data.bmpstruct1.py同在一个Windows目录下,完整路径:G:\newpython\data.bmpG:\newpython\struct1.py

例子:

#!/usr/bin/env python
# -*- coding: utf-8 -*- import sys
import struct
from collections import namedtuple def bmg_info(weitu):
with open(weitu, 'rb') as f:
data = f.read(30)
info = BMGinfo(*struct.unpack('<ccIIIIIIHH', data))
if info.ch1 == b'B' and (info.ch2 == b'M' or info.ch2 == b'A'):
return {
'width': info.width,
'height': info.height,
'color': info.colornum
}
return None if __name__ == "__main__":
BMGinfo = namedtuple('BMGinfo', ('ch1','ch2','size','reserved','offset','headerbits','width','height','num','colornum'))
weitu = sys.argv[1]
print(bmg_info(weitu))

打开cmd,进入目录G:\newpython,执行命令:python struct1.py "G:\newpython\data.bmp"即可看见惊喜。

这篇博客说到这里,终于到了重要的地方。其实在实践这段代码时,我遇见了几个问题(错误):

  1. 遇到错误(AttributeError: module 'struct' has no attribute 'unpack'),原来是我自己的py文件不要和系统的模块名重名,解决办法,把文件名改掉(我这里把struct.py改为struct1.py);
  2. 灵活运用namedtuple。了解更多请看这里
  3. 灵活运用可变参数技能(*struct.unpack('<ccIIIIIIHH', data)),关于可变参数,看这里

0x10

感谢阅读。