机器数
机器数是数字在计算机中的二进制表示形式。机器数有2个特点:一是符号数字化,二是其数的大小受机器字长的限制。
机器数可以是带符号的,也可以是不带符号的。带符号的机器数用来表示正数、负数和零,而不带符号的机器数只能表示非负整数。在计算机中,通常使用有符号的机器数来进行算术运算和表示数据。但是,在某些情况下,无符号的机器数也会被使用,例如在位运算和处理二进制数据时。
在计算机用机器数的最高位存放符号,正数为0,负数为1。比如,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是0000 0011。如果是 -3 ,就是 100 00011 。那么,这里的 0000 0011 和 1000 0011 就是机器数。
原码、反码、补码都属于机器数的形式
真值
机器数的真值是指它所代表的实际数值。对于无符号的机器数,其真值就是它本身;而对于有符号的机器数,其真值需要根据其表示方式进行计算。
例如有符号数 1000 0011,其最高位1代表负,其真正数值是 -3
原码
用第一位表示符号,其余位表示值。因为第一位是符号位,所以8位二进制数的取值范围就是:[1111_1111 , 0111_1111] 即 [-127 , 127] ,原码是容易被人脑所理解的表达方式。
8位二进制数的取值范围是从00000000(0)到11111111(255),其中最高位为符号位,表示正负。如果使用补码表示法,则取值范围为从10000000(-128)到01111111(+127)。
平时所说的8位有符号二进制数的取值范围是从10000000(-128)到01111111(+127),其中最高位为符号位,表示正负。这个范围是根据补码表示法计算得出的。
反码
正数的反码是其本身,负数的反码是符号位保持不变,其余位取反。
例如正数1的原码是[0000_0001],它的反码是是其本身[0000_0001],
-1的原码是[1000_0001],其反码是[1111_1110]
补码
正数的补码是其本身,负数的补码是在其反码的基础上+1,
例如正数1的原码是[0000_0001],他的补码是其本身[0000_0001],
-1的补码是[1111_1111]
在八位二进制下,-128不能用原码或反码表示,原码、反码只能表示0到127,-0到-127;补码没有正0与负0之分,[-0]反码的第一个1是符号位,尾数中的7个1是数值位,尾数加一后,数值位产生了进位,1111 1111+1=1 0000 0000(计算补码的过程中,并不是先保证第一位不变,而是保证符号位不变,保证补码规则是反码整体加一)。所以,补码能表示的数的个数中,比原码反码少了一个,所以补码可以多表示一个真值为-128的数。
十进制 | 原码 | 反码 | 补码 |
---|---|---|---|
-128 | 1000 0000(超过范围,进位被舍去) | 1111 1111(原码超过范围) | 1000 0000(±0补码相同,负数可以多表示1个值) |
-127 | 1111 1111 | 1000 0000 | 1000 0001 |
… | … | … | … |
-2 | 1000 0010 | 1111 1101 | 1111 1110 |
-1 | 1000 0001 | 1111 1110 | 1111 1111 |
-0 | 1000 0000 | 1111 1111 | 0000 0000 |
+0 | 0000 0000 | 0000 0000 | 0000 0000 |
1 | 0000 0001 | 0000 0001 | 0000 0001 |
2 | 0000 0010 | 0000 0010 | 0000 0010 |
… | … | … | … |
126 | 0111 1110 | 0111 1110 | 0111 1110 |
127 | 0111 1111 | 0111 1111 | 0111 1111 |
其中,正数的源码、反码和补码都相同,而负数的反码是将其源码中所有位取反(0 变成 1,1 变成 0),补码是在反码的基础上加 1。注意到对于有符号整数,最高位为符号位,0 表示正数,1 表示负数。因此,0 的二进制补码是 00000000,而不是 10000000。
n位有符号数二进制补码的取值范围为-2^(n-1) 到 2^(n-1)-1
在计算机中,对于有符号数的加减法运算,都是通过补码进行的。
-128的由来 :最高位为符号位,所以剩下7位代表0-127 ,所以能从-127表示到127,由于+0和-0都表示0,重复了,所以多出一个位子表示负数。对于一个8位的补码表示法,最大值为01111111(+127),最小值为10000000(-128),而没有-0这个值。
在一些特定的应用场景中,可能会将10000000解释为-0,但这不是补码的标准定义。在实际编程中,应该避免使用-0这种非标准的表示方法,以免引起混淆和错误。
有了原码为什么要使用反码和补码
因为人脑可以知道第一位是符号位,可以根据符号位对真值的绝对值进行加减乘除,但是对于计算机来说,加减乘除是最最最基本的运算,要设计的尽量简单,计算机辨别符号位会让计算机的设计电路变得很复杂,于是人们想出了让符号位也参与到运算上来。减去一个数,等于加上他的负数。
使用原码参数运算的缺陷
从上面的原码表中可以看见左边每增加一个二进制单位对应的真数是递减的,而右边每增加一个二进制单位对应的真数是递增的,所以对于原码来说,能满足正数的加法,但无法满足负数的加法
2+1 = [0000_0010]原+[0000_0001]原=[0000_0011]原 = 3
1+(-1)=[0000_00001]原+[1000_0001]原=[1000_0010]原=-2
为了满足负数对加法的需求,就必须让负数与他对应的二进制码是同步递增或者同步递减
于是就通过符号位不变,其余位取反来满足这个同步递增或者递减的要求,由于正数本来就满足它本身的加法,所以不需要做任何改变。这就是反码的定义由来。
从上图的反码表中可以看到在运算不跨过0的时候,正负数的加法已经能满足要求
-2+1=[1111_1101]反+[0000_0001]反=[1111_1110]反=-1
127+1=[1000_0000]反=-127=128 加法算出来是128,由于128超过最大值,余1,所以取最小值开始的第一位,也就是
最小值-127,但是这里有个不合理的地方,就是[1111_1111]和[0000_0000]都表示0,这导致在实际计算中每当跨过0一次,就有一个单位的误差
-1+2=[1111_1110]反+[0000_0010]反=[0000_0000]反=0
要解决这个问题就必须让反码中的[1111_1111]和[0000_0000]合并,
由于[1111_1111]+[0000_0001]=[0000_0000],所以在负数反码的基础上+1就可以解决反码中跨0的误差问题,同时不会对负数与它对应的二进制反码的同步递增产生影响,所以在反码的基础上+1就完美的解决了符号参与预算的问题,这就是补码为什么是在负数反码的基础上+1的由来。
从上面的图中发现还有一个[1000_0000]的二进制没有对应任何真数,于是就规定了这个数的真数是-128
所以补码的表示范围是[-128~127] ,这样一来256个二进制正好表示256个整数,在实际二进制的运算中超过范围其实就是对256的取余运算(x+128)mod 256 - 128。