转载请标明出处:https://blog.csdn.net/qq_29621351/article/details/81238589
字节序,顾名思义就是计算机存储基本数据类型时 字节的排列顺序,计算机存储字节的顺序分为两种:大端字节序和小端字节序,存储方式为 大端字节序的0x11在硬件地址的高位,而小端字节序的0x11在地址的低位。如图
数值:0x11223344
大端:0x11223344
小端:0x44332211
那么为什么要有这样的区别,难道就不能统一吗?因为人类看数字的习惯是从左开始向右看,比如1227,是按照千位,百位,十位,个位的顺序看,而计算机处理数据时,是从地址的低位向着地址的高位处理,所以如果为了符合两个原则,所以0x11就应该放在地址的低位,就是小端字节序的方式,这种方式效率高,但是在书面表示的时候不太符合人的直观感受,所以也有另一种字节排序方式就是大端模式,0x11放在地址的高位,依次向低位移动。现在的计算机在存储和处理方面大部分都采用了小端字节序,但是在网络传输的过程中,为了更加直观的表示数字,就采用了大端字节序。
所以计算机从网络中收取到数据块时,如果没有经过转换直接存储到文件中,再次读取出来时,会出现错误。下面是一段测试程序,供大家参考。
#include <stdint.h>
#include <iostream>
#include <fstream>
#include <winsock.h>
#pragma comment(lib,"ws2_32")
#pragma pack(1)
struct TEST
{
unsigned char v : 2;
unsigned char p : 1;
unsigned char x : 1;
unsigned char c : 4;
unsigned char m : 1;
unsigned char pt : 7;
};
#pragma pack()
int main()
{
uint32_t a = 0x11223344;
unsigned char *p = (unsigned char *)(&a);
printf("小端字节序:%0x %0x %0x %0x\n", p[0], p[1], p[2], p[3]);
uint32_t b = ntohl(a);
unsigned char *q = (unsigned char *)(&b);
printf("大端字节序:%0x %0x %0x %0x\n", q[0], q[1], q[2], q[3]);
printf("a = %0x\n", a);
printf("b = %0x\n", b);
TEST r = { 2,0,0,15,0,0 };
std::ofstream out("C:/Users/tengxc/Desktop/research.binary", std::ios::binary);
out.write(reinterpret_cast<char*>(&r), sizeof(TEST));
out.close();
getchar();
return 0;
}
例子中包括基本数据类型的字节序和占位符定义的结构体类型的字节序,uint32_t类型a在内存中的的存储方式为0x44332211,而b是修改了存储方式的a,修改存储方式之后,b仍然在此计算机中,所以仍然使用小端读取方式,所以b表示的值变成了0x44332211,此外要介绍4个函数。
#include <arpa/inet.h> (Linux头文件)
uint32_t htonl(uint32_t hostlong);
uint32_t ntohl(uint32_t netlong);
uint16_t htons(uint16_t hostshort);
uint16_t ntohs(uint16_t netshort);
表示主机与网络中不同长度整型字节序的相互转换,
host to network long (32bit)
network to host long (32bit)
host to network short (16bit)
network to host short (16bit)
占位符的字节序转换,主要是单个字节内部的占位符元素的顺序反转。大家可以用这个例子写个文件用二进制编辑器打开看看,这里不再赘述。