Python: struct 模块之字节对齐问题

$Python$ 在二进制写文件时，可以用 $struct$ 模块将数据捆绑成结构体转化成字节流，为了方便与 $C$ 交互，避免 $C$ 在读取二进制字节流时因为 $C$ 的字节对齐问题而造成不必要的麻烦， $Python$ 的 $struct$ 模块默认按照 $C$ 的字节对齐方式进行对齐。

然而，并不像想象中那样简单。 $Python$ 的 $struct$ 模块的字节对齐坑了我整整一上午。

首先我用 $Python$ 写好了二进制文件，并且测试用 $Python$ 去读取该二进制文件，测试良好，没有什么问题，但是当我写 $C$ 的接口时，却发现数据一直有问题。经过一上午的排查，总算发现，字节的读取地址出现了问题，然而 $Python$ 的却没有这个问题，所以一下子就断定是 $struct$ 模块的字节对齐出了幺蛾子。

这里我用 $Python$ 写进了一堆 $Header$ ，

struct header
{
	long long a;
	int b;
};

转化成 $struct$ 模块的格式化字符串为 $'qi'$ ，在 $C$ 中，由于字节对齐的缘故，这个 $Header$ 应该占有 $16$ 个字节，但是在 $Python$ 里却不是这样……

>>> import struct
>>> struct.calcsize('qi')
12

竟然等于 $12$ 个字节，显然没有字节对齐……然后试了一下 $'iq'$ ，又让我吃了一惊……

>>> struct.calcsize('iq')
16

你没有看错，这里竟然字节对齐了，变成了 $16$ 字节。这波操作骚气啊……

用 $C$ 反复测试了两种写法，结果均为 $16$ 字节。

不知道该怎么喷 $Python$ ，最后图个省事儿，弄成了 $'2q'$ ，妈妈再也不用担心字节对齐的问题了。

不过，有那么一种可能是，不同的 $C$ 编译器对这两种写法的字节对齐方式存在差异？不得而知，也没有具体去测试，毕竟我是一个不求甚解的人。

对了，如果有哪位大佬的编译器的确是不一样的字节对齐结果，麻烦告知用的是什么编译器，让我避开他……

Python: struct 模块之字节对齐问题

猜你喜欢