校招基础——浮点数的定点化

时间:2024-03-12 12:25:41

一、概念

1、浮点数:小数点位置是漂浮不定的。

  例如:浮点数运算 1.1 * 1.1 = 1.21,小数点位置发生了变化。

  IEEE 754 规定,浮点数的表示方法为:

  最高的 1 位是符号位 s,接着的 8 位是指数E,剩下的 23 位为有效数字 M。

2、定点数:小数点的位置是确定的。

  例如:定点数运算 1.1 * 1.1 = 1.2,小数点的位置没有变化。

 

   定点的意思是,小数点固定在 32 位中的某个位置,前面的是整数,后面的是小数。

  小数点具体固定在哪里,可以自己在程序中指定。

二、Verilog表示定点数

  FPGA 的寄存器只可以表示正整数,通过约定【最高位为符号位】则可以表达负整数了。同理,带小数点的定点数也是可以通过一些约定来表示。

  约定方法:确定小数点的位置。如下图所示,Qn表示小数点的位置,n为多少表示有多少位小数,看看同样的二进制数字“10101”会变成什么。

二进制数    小数点位置    对应定点数
 10101        Q0        10101
 10101        Q1        1010.1
 10101        Q2        101.01
 10101        Q3        10.101
 10101        Q4        1.0101
 10101        Q5        0.10101

  因此我们只要定位了小数点位置后,就可以在FPGA中表达带小数的定点数。

 

三、浮点数的定点化

  两个 16 位的浮点数运算,最高位是符号位: 2.918 * 3.1415926 = 9.1671672068,尝试将浮点数进行定点化。

1、定点转换(Qn=12)

  符号1位,整数取3位(实际2位就够),小数12位,可以看成把 1 分成了 212份,因此:

  • 2.918  * 212        = 11952.168         = 11952;
  • 3.1415926 * 212 = 12867.8632896 = 12868;

2、定点数相乘

  11952 * 12868 = 153798336。

3、结果还原

  相乘后,整数部分为 6 位,小数部分为 24 位。因此结果 = 153798336 / 224 = 9.167095184326171875,和原计算值差距非常小。

4、量化误差和量化精度

  小数点的位置不同带来的量化误差不同,例如上面定点转换的过程中出现的小数点进行了四舍五入,这是因为 2.918 无法完全用 1/212来表示。小数位数越多,表示的量化精度越高,小数位为 Qn,最大量化精度为 1/2n

5、无损定点化

  所谓【无损定点化】只是数学概念,只要量化误差小于精度的一半,就认为是“无损”的。按照这个标准,那对小数点采取四舍五入的结果必然是无损的。但是校招时很多题采取的是“量化后直接去除小数”,那么小数大于 0.5 则不是无损的了。

 

四、例题

1、【大疆】对 12.918 做无损定点化,需要的最小位宽是多少位?位宽选择 11 位时的量化误差是多少?

A   13位,0.0118
B   12位,0.0118
C   13位,0.0039
D   12位,0.0039

  分析:(1)整数 12 需要 4bit。假设位宽选择12位,即小数需要 8bit,12.918 * 28 = 3307.008,定点化后的小数小于0.5,可以看成是【无损定点化】,固答案为 12 位;(2)位宽选择11位,即小数需要 7bit,12.918 * 27 = 1653.504,量化误差为 0.504/27 = 0.0039375,固答案为0.0039。

  答案:结合分析,得出答案为D。

 

2、【大疆】对12.758做无损定点化,需要的最小位宽是多少位?位宽选择为8位时的量化误差是多少?

A   11位,0.008
B   11位,0.08
C   12位,0.008
D   12位,0.08

  分析:(1)整数 12 需要 4bit。假设位宽选择11位,即小数需要 7bit,12.758 * 27 = 1633.024,定点化后的小数小于0.5,可以看成是【无损定点化】,固答案为 11 位;(2)位宽选择 8 位,即小数需要 4bit,12.758 * 24 = 204.128,量化误差为 0.128/24 = 0.008,固答案为0.008。

  答案:结合分析,得出答案为A。

  感觉这题的第一问有些毛病,位宽为 8 位时也符合【无损定点化】。我算了一下,位宽为 7 位(小数为3位)时仍然是【无损定点化】,位宽为 6 位时才不是【无损定点化】。但这是选择题,只能选 A 了。

 

参考资料:

http://fpgabbs.com/thread-771-1-1.html

https://www.cnblogs.com/bixiaopengblog/p/7728538.html

https://mp.weixin.qq.com/s/kKMyIzrPBJDdLRd71WjDKg