主要贡献:
一种完全二值化网络(bCorNET)拓扑结构及其相应的算法-架构映射和高效实现。对CorNET进行量化后,减少计算量,又能实现减轻运动伪影的效果。 该框架在22个IEEE SPC受试者上的MAE为6.67±5.49 bpm。该设计采用ST65 nm技术框架,实现3 GOPS @ 1 MHz,每个窗口消耗56.1 μ J \mu J μJ,占用1634K NAND2等效单元面积,从PPG信号估计每隔2s的HR延迟,变为32 ms。关键在于用硬件直接搭建出CNN LSTM网络。这个算法和硬件都会太强了!
理论部分的量化公式:
q u a n t i z e ( x ) = r o u n d ( c l i p ( x , − 1 , 1 ) × M ) / M Q ( x ) = s × q u a n t i z e ( x − p s ) + p \begin{gathered} q u a n t i z e(x)=r o u n d(c l i p(x,-1,1)\times M)/M \\ Q(x)=s\times q u a n t i z e\left(\frac{x-p}{s}\right)+p \end{gathered} quantize(x)=round(clip(x,−1,1)×M)/MQ(x)=s×quantize(sx−p)+p
算法流程图:
硬件实现流程和时序图:
硬件实现:
CNN1单层实现:
Binarizer架构:
Binary max-pooling单元:
转置Buffer架构:
CNN:
LSTM:
bLSTM时序图:
实验结论:
**参考:**
Binary CorNET Accelerator for HR Estimation From Wrist-PPG