字节跳动的“并行翻译”技术打破“自回归模型”技术的绝对统治地位

在2021年WMT国际机器翻译大赛上,字节跳动火山翻译团队凭借着自己研发的并行翻译”系统在成功打破“自回归模型”技术在机器翻译领域的绝对统治地位的同时一举夺下魁首。

相信很多用户对这个“自回归模型”技术和“并行翻译”技术不太了解。下面就为朋友们简单的说明一番。

其实这个“自回归模型”技术,它的演算和翻译都非常接近人类逐词按顺序阅读翻译的习惯。而由字节跳动研发的“并行翻译”技术运行的方式则是由机器同步输出所有的词,可以充分利用并行计算,将翻译速度提高数十倍。句子越长,速度提升越明显。

火山翻译团队采用的是一项创新时的渐进学习方式,由简单到复杂、由片段到整句训练“并行翻译”模型,由此来打破如何组成连贯语句的技术难点。并且在保持极高翻译速度的同时,翻译的质量显著提升。

火山翻译团队负责人说,在训练数据量小的场景下,这个技术的质量相比传统的技术仍处于一个劣势状态,但是当训练数据规模变大以后,就会逐渐缩小与传统技术的差距,甚至还可以称的上是反超。

看完这些想必有不少朋友非常看到这个“并行翻译”技术的未来行情吧!目前这个技术已经被字节跳动应用在火山翻译产品中,并支持字节跳动的部分业务。

查看全部

同类推荐

精品推荐

网友评论

同类下载