内容字号:默认大号超大号

段落设置:段首缩进取消段首缩进

字体设置:切换到微软雅黑切换到宋体

重磅 谷歌神经机器翻译再突破:实现高质量

2018-10-17 12:56 出处:未知 人气: 评论(0

  原标题:重磅 谷歌神经机器翻译再突破:实现高质量多语言翻译和zero-shot翻译(附论文)

  昨天,谷歌在其官方博客上宣布其在谷歌翻译(Google Translate)上再次取得重大进展。这家搜索巨头表示现在已经将神经机器翻译(neural machine translation)集成到了其网页版和移动版的翻译应用之中,这意味着它可以一次性翻译一整段句子,而不只是像之前一样只能一个词一个词地翻译。

  谷歌在其产品博客中表示,其产品的翻译结果现在变得更加自然,能够实现更好的句法和语法。

  Google Translate 产品负责人 Barak Turovsky 在谷歌旧金山的一次新闻发布会上说:「这一次的进步超过了过去十年积累的总和。」

  谷歌已经将自己的未来定义成了一家人工智能和机器学习公司——使用这些技术的计算机无需特定的编程就能自己学习执行任务。谷歌云部门(cloud division)的负责人 Diane Greene 总结说:「谷歌要将机器学习集成到每一种形式中,并将它带给这个世界。」

  今天我们宣布将神经机器翻译集成到了总共八种语言的相互翻译中,它们是:英语、法语、德语、西班牙语、葡萄牙语、汉语、日语、韩语和土耳其语。这些语言的母语总人口占到了世界总人口的三分之一,覆盖了谷歌翻译 35% 以上的请求。

  通过这一次更新,谷歌翻译一次性提升的性能超过了过去十年进步的总和。但这只是一个开始。尽管我们目前在谷歌搜索、谷歌翻译应用和网站上只有 8 种语言,但我们的目标是将神经机器翻译扩展到所有 103 种语言,并让你能随时随地都能接入到谷歌翻译。

  除此之外,谷歌今天还宣布了提供机器学习 API 的公共云服务 Google Cloud Platform,「能让任何人都轻松地使用我们的机器学习技术」。今天,Google Cloud Platform 也使神经机器翻译背后的系统向谷歌的企业用户开放了——谷歌提供了 Cloud Translation API:

  我们提出了一种使用单个神经机器翻译(NMT)模型在多种语言之间进行翻译的简洁优雅的解决方案。我们的解决方案不需要对我们的基础系统的模型架构进行修改,而是在输入句子的一开始引入了一个人工 token 来确定所需的目标语言(required target language)。模型的其它部分(包含了编码器、解码器和注意(attention))保持不变,而且可以在所有语言上共享使用。使用一个共享的词块词汇集(wordpiece vocabulary),我们方法能够使用单个模型实现多语言神经机器翻译(Multilingual NMT),而不需要增加参数,这比之前提出的 Multilingual NMT 方法简单多了。我们的方法往往能提升所有相关语言对的翻译质量,同时还能保持总的模型参数恒定。

  在 WMT 14 基准上,单个多语言模型在英语→法语翻译上实现了与当前最佳表现媲美的结果,并在英语→德语翻译上实现了超越当前最佳表现的结果。类似地,单个多语言模型分别在 WMT14 和 WMT15 基准上实现了超越当前最佳表现的法语→英语和德语→英语翻译结果。在用于生产的语料库上,多达 12 个语言对的多语言模型能够实现比许多单独的语言对更好的表现。

  除了提升该模型训练所用的语言对的翻译质量之外,我们的模型还能执行在训练过程中没有明确遇见过的语言对之间的特定桥接(bridging),这表明用于神经翻译的迁移学习(transfer learning)和 zero-shot 翻译是可能的。

  最后,我们展示了对我们模型中的通用语言间表征(universal interlingua representation)的迹象的分。

分享给小伙伴们:
本文标签: 谷歌论文翻译

相关文章

评论

发表评论愿您的每句评论,都能给大家的生活添色彩,带来共鸣,带来思索,带来快乐。

签名: 验证码: 点击我更换图片

评论列表

    Copyright © 2002-2018 北京pk10走势图 版权所有|黔ICP备16006823号-1