双-单-半精度浮点数的细节 - 代码天地

双-单-半精度浮点数的细节

其他 2020-03-21 00:17:31 阅读次数: 0

浮点数也就是小数点浮动的数，但是因为在计算机中使二进制表示，不同长度有不同的精度。三种常用的浮点数的格式：半精度（float16）、单精度（float32）、双精度（float64）

Value=sign*exponent*fraction
数值=符号位*指数位*小数位

符号位表示正负
指数位表示次方
小数位表示精度

区别在于指数位和小数位的长度的差异；这样近似值其实也就是有理数的表示方法；

半精度表示π，最大值和最小值：

单精度表示π，最大值和最小值：

双精度表示π，最大值和最小值：

Bfloat16

最近还诞生了一种Bfloat16的计数方式，使用和半精度相同的位数，实现了保持和单精度一样的指数位也就是8位指数位，可以表示和单精度相同的数字范围，但是牺牲了小数位也就是精度。

参考文献：

http://evanw.github.io/float-toy/

https://en.wikichip.org/wiki/brain_floating-point_format

猜你喜欢

转载自www.cnblogs.com/kongchung/p/12535798.html

双-单-半精度浮点数的细节

js 双精度浮点数

浮点数的精度

浮点数精度

用JSP完成输入整形,单精度浮点数,双精度浮点数

单精度浮点数（float）与双精度浮点数（double）的区别:

浮点数(实数)中单精度与双精度区别

java细节：浮点数精度丢失问题的原因

什么是浮点型？什么是单精度浮点数（float）以及双精度浮点数（double）？

浮点数精度问题

浮点数精度的转换

java 浮点数精度

浮点数的精度问题

关于浮点数的精度

浮点数精度丢失

C语言实例：输出浮点数和双精度浮点数的四种函数

Python 双字节十六进制到半精度浮点数的转换

fp16半精度浮点数转成float类型------C/C++

CUDA 半浮点数运算

php 浮点数精度运算问题

golang浮点数精度问题

PHP浮点数精度损失问题

java浮点数运算精度问题

浮点数精度丢失的原因

js浮点数精度问题

JavaScript 浮点数运算的精度问题

PHP浮点数运算精度

MATLAB浮点数精度问题

python 浮点数的精度问题

Python中浮点数精度处理

今日推荐

周排行

Leetcode简单题61~80

解决zookeeper磁盘IO高的问题

多线程相关方法详解

Maven-setting.xml文件详解

Maven 项目的 classpath 理解

渊亭科技大数据笔试题

配置JVM内存分配

计算机网络个人学习笔记（三）网络层：第三部分连载

js中两个等号(==)和三个等号(===)的区别

用C程序自动打开电脑上的程序

每日归档

更多

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)

2024-09-09(0)