本发明提供了一种基于特征值区域的动态量化方法,包括:步骤1:定位输入特征图中的敏感区域和非敏感区域;步骤2:对敏感区域和非敏感区域执行混合精度卷积;步骤3:将卷积结果提供给激活层和池化层;步骤4:在不同敏感度区域之间进行切换。本发明对输入特征图和权重进行量化,进而可以更好地保留NN的准确率;DRQ可以支持层内、甚至逐像素的量化,这种细粒度的量化策略为量化提供了更大的自由,可以在尽可能降低计算精度的情况下保证NN准确率。
上海交通大学
宋卓然 | 梁晓峣 | 景乃锋 | 江昭明 | 官惠泽 | 吴飞洋 | 王雅洁
