tensorflow模型量化不并不提速,并且可能会降低速度。他只能压缩模型。
为什么不能提速?官方给的解释是,巴拉巴拉巴拉。。忘了。就是说矿界n
量化有两种方式,tflite和pb两种保存方式。tflite是量化+轻量化;pb得格式是只量化(这种方法可能只在linux跑模型,win会报错。我是tf-1.15.0版本,win不行。)。
所以就是说,别去尝试手动自己写代码去量化了,就用官方得代码,压缩下模型就得了。
也就是说,你用tf的话,不用看量化的论文。
tensorflow模型量化不并不提速,并且可能会降低速度。他只能压缩模型。
为什么不能提速?官方给的解释是,巴拉巴拉巴拉。。忘了。就是说矿界n
量化有两种方式,tflite和pb两种保存方式。tflite是量化+轻量化;pb得格式是只量化(这种方法可能只在linux跑模型,win会报错。我是tf-1.15.0版本,win不行。)。
所以就是说,别去尝试手动自己写代码去量化了,就用官方得代码,压缩下模型就得了。
也就是说,你用tf的话,不用看量化的论文。