如何用AI让翻译质量越来越好?
|
谷歌表示,其翻译质量的突破并不是由单一技术推动,而是针对资源较少的语言、高质量源语言、总体质量、延迟和整体推理速度的技术组合。在2019年5月至2020年5月之间,通过人工评估和BLEU(一种基于系统翻译与人工参考翻译之间相似性的指标)进行衡量,谷歌翻译在所有语言中平均提高了5分或更多,在50种最低水平的翻译中平均提高了7分或更多。此外,谷歌表示,“翻译”对机器翻译联想的功能变得更加强大,一种现象是,当给泰卢固语字符“షషషషషష”输入,“Shenzhen Shenzhen Shaw International Airport (SSH)”)时,AI模型会产生奇怪的翻译“Sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh sh”。 混合模型和数据挖掘器 这些技术中的第一个是翻译模型体系结构——一种混合体系结构,包含在Lingvo(用于序列建模的TensorFlow框架)中实现的Transformer编码器和递归神经网络(RNN)解码器。 在机器翻译中,编码器通常将单词和短语编码为内部表示,然后解码器将其用于生成所需语言的文本。谷歌相关研究人员于2017年首次提出的基于Transformer模型在此方面比RNN更为有效,但谷歌表示其工作表明大部分质量提升仅来自于Transformer的一个组成部分:编码器。那可能是因为虽然RNN和Transformer都被设计为处理有序的数据序列,但是Transformers并不需要按顺序处理序列。换句话说,如果所讨论的数据是自然语言,则Transformer无需在处理结尾之前处理句子的开头。
尽管如此,在推理时,RNN解码器仍比“Transformer”中的解码器“快得多”。意识到这一点,Google Translate团队在将RNN解码器与Transformer编码器结合之前对RNN解码器进行了优化,以创建低延迟、质量更高,比四年前基于RNN的神经机器翻译模型更稳定的混合模型进行替代。 (编辑:孝感站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

