1.体系结构层面:脉动阵列 2.算法层面:Winograd、FFT、针对稀疏矩阵的winograd 3.软硬件协同设计: 软件:结构化压缩取代非结构压缩:结构化压缩采用循环矩阵 存储将为1/k,计算降为1/log(k) 硬件: 4.工具链层面:使用接口直接调用