端到端Transformer模型的混合精度后量化

论坛 › 期权论坛 › 脚本

 匿名技术用户  2021-1-15 00:28  320  0

端到端Transformer模型的混合精度后量化，需要克服如下难点：

Transformer自回归模型，包含了Encoder与Decoder；端到端模型压缩的支持，需要考虑自回归逻辑（Beam Search）的复杂实现；
后量化需要考虑合理、有效的PTQ策略（PTQ: Post-training Quantization），确保量化后精度鲁棒性；
混合精度决策需要考虑实现的高效性，通常采用Label-free方式；

具体可参考端到端语音识别的移动端解决方案——"移动端实时语音识别技术方案及应用"：

回复

分享到 :

0 人收藏

16级独孤

匿名技术用户

积分:7942463

帖子:1588486

精华:0

+ 关注私信

期权论坛

期权论坛

期权网络科技版权所有: 关于我们; 联系我们; 加入我们; 反馈问题; 免责声明; 积分充值

统一社会信用代码: 积分规则; 网站地图; 爱文库; 下属网站

官方: 新浪微博; 微信公众号
◆

下载: 表情包; App下载

期权论坛

期权论坛

QQ咨询|关于我们|Archiver|手机版|小黑屋|( 辽ICP备15012455号-4 ) Powered by 期权论坛 X3.2 © 2001-2016 期权工具网&期权论坛 Inc.