本文作者:sukai

网络技术翻译(网络技术 翻译)

sukai 01-02 123

  以往用过百度或是谷歌翻译的都知道,利用基于短语的机器翻译系统(PBMT)翻译出来的结果准确度较低,因为它将每一句话都拆分成了一个个独立的短语再进行翻译,至于句子结构以及上下午语义则全都抛之脑后,词不达意也是常有的事。

  一直以来谷歌都在致力于 AI 技术的研发与应用,就在今日上午,他们发布了网页与移动版的神经机器翻译系统(GNMT),即将告别过去的 PBMT 系统。

网络技术翻译(网络技术 翻译)

  其实早在数年前,谷歌就已经开始尝试利用递归神经网络(RNNs)技术学习翻译句与被翻译句之间的映射关系。与 PBMT 不同的是,这种神经机器翻译(NMT)的方法并不会对句子进行切割。当初进行系统测试时,该方式在少量语句的翻译精度上与 PBMT 方式相当,而且大幅度简化了翻译系统。然而神经网络技术对于产品的处理能力要求非常高,以当时的技术水平而言,NMT 无法在数据过多的情况下使用,也因此限制了它的后续发展。

  但 GNMT 如今作为最新成果,不仅能够实现句子信息的快速翻译,PBMT 也能做到更贴近人工翻译的效果。

  谷歌在展示这项 GNMT 技术时用了一个中译英的例子。具体来说,首先它给每个中文单词都划分了不同的向度,它们涵盖了这个词所有可能的解释。当整个句子的所有单词都被划分完成后,解码的过程就开始了,每次解码后都会产生一个英语单词,不同的向度有不同的权重,根据翻译过程中的相关性原理,算法会采用最接近的翻译来进行解码。

  根据诸多使用者的评价,GNMT 系统相比 PBMT,其错误率已经下降了 60%。此外,经过专业双语翻译人员的评估,GNMT 的翻译错误率已经减少了 55%-58%。

  除了中译英,谷歌还选择了西班牙语、法语作为补充测试,结果显示无论是哪两种语言的翻译,GNMT 系统给出的答案相比 PBMT 系统有一个明显的提升。

  虽然谷歌在机器翻译上取得了不小的进展,但 GNMT 也有一些不尽如人意的地方。例如会漏掉一些单词,把一些常见名字或少见的专有名词弄错,以及对文章语境缺乏整体的把控等。

  *本文由 粹客网原创,如需转载,请标明出处和原文链接

  *有 VR/AR 创业项目想被报道?发邮件到这里:tougao@cheekr.com。

阅读
分享