如何用AI让翻译质量越来越好？

发布时间：2021-02-22 16:40:49 所属栏目：动态来源：互联网

导读：谷歌表示，其翻译质量的突破并不是由单一技术推动，而是针对资源较少的语言、高质量源语言、总体质量、延迟和整体推理速度的技术组合。在2019年5月至2020年5月之间，通过人工评估和BLEU（一种基于系统翻译与人工参考翻译之间相似性的指标）进行衡量，谷歌翻

谷歌表示，其翻译质量的突破并不是由单一技术推动，而是针对资源较少的语言、高质量源语言、总体质量、延迟和整体推理速度的技术组合。在2019年5月至2020年5月之间，通过人工评估和BLEU（一种基于系统翻译与人工参考翻译之间相似性的指标）进行衡量，谷歌翻译在所有语言中平均提高了5分或更多，在50种最低水平的翻译中平均提高了7分或更多。此外，谷歌表示，“翻译”对机器翻译联想的功能变得更加强大，一种现象是，当给泰卢固语字符“షషషషషష”输入，“Shenzhen Shenzhen Shaw International Airport (SSH)”）时，AI模型会产生奇怪的翻译“Sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh”。

混合模型和数据挖掘器

这些技术中的第一个是翻译模型体系结构——一种混合体系结构，包含在Lingvo（用于序列建模的TensorFlow框架）中实现的Transformer编码器和递归神经网络（RNN）解码器。

在机器翻译中，编码器通常将单词和短语编码为内部表示，然后解码器将其用于生成所需语言的文本。谷歌相关研究人员于2017年首次提出的基于Transformer模型在此方面比RNN更为有效，但谷歌表示其工作表明大部分质量提升仅来自于Transformer的一个组成部分：编码器。那可能是因为虽然RNN和Transformer都被设计为处理有序的数据序列，但是Transformers并不需要按顺序处理序列。换句话说，如果所讨论的数据是自然语言，则Transformer无需在处理结尾之前处理句子的开头。

尽管如此，在推理时，RNN解码器仍比“Transformer”中的解码器“快得多”。意识到这一点，Google Translate团队在将RNN解码器与Transformer编码器结合之前对RNN解码器进行了优化，以创建低延迟、质量更高，比四年前基于RNN的神经机器翻译模型更稳定的混合模型进行替代。

（编辑：孝感站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

我们自己能决定平台推	用互联网来分配能源，
科沃斯石头科技开展打	沉浸式陷入内卷国内