在二进制写文件时,可以用 模块将数据捆绑成结构体转化成字节流,为了方便与 交互,避免 在读取二进制字节流时因为 的字节对齐问题而造成不必要的麻烦, 的 模块默认按照 的字节对齐方式进行对齐。
然而,并不像想象中那样简单。 的 模块的字节对齐坑了我整整一上午。
首先我用 写好了二进制文件,并且测试用 去读取该二进制文件,测试良好,没有什么问题,但是当我写 的接口时,却发现数据一直有问题。经过一上午的排查,总算发现,字节的读取地址出现了问题,然而 的却没有这个问题,所以一下子就断定是 模块的字节对齐出了幺蛾子。
这里我用 写进了一堆 ,
struct header
{
long long a;
int b;
};
转化成 模块的格式化字符串为 ,在 中,由于字节对齐的缘故,这个 应该占有 个字节,但是在 里却不是这样……
>>> import struct
>>> struct.calcsize('qi')
12
竟然等于 个字节,显然没有字节对齐……然后试了一下 ,又让我吃了一惊……
>>> struct.calcsize('iq')
16
你没有看错,这里竟然字节对齐了,变成了 字节。这波操作骚气啊……
用 反复测试了两种写法,结果均为 字节。
不知道该怎么喷 ,最后图个省事儿,弄成了 ,妈妈再也不用担心字节对齐的问题了。
不过,有那么一种可能是,不同的 编译器对这两种写法的字节对齐方式存在差异?不得而知,也没有具体去测试,毕竟我是一个不求甚解的人。
对了,如果有哪位大佬的编译器的确是不一样的字节对齐结果,麻烦告知用的是什么编译器,让我避开他……