Google神经机器翻译系统
来自维基百科,自由的百科全书
Google神经机器翻译系统(英语:Google Neural Machine Translation,简写:GNMT),是Google开发的神经机器翻译(NMT)系统,于2016年11月推出,它使用人工神经网络来提高Google翻译的流畅度和准确性。[1][2][3]Google神经机器翻译系统通过应用基于实例的(EBMT)机器翻译方法来改进翻译质量,系统会从数百万个示例中学习。[2]翻译系统提出的系统学习架构首先通过Google翻译支持的一百多种语言进行了测试。[2]随着大型端到端框架的发展,系统会随着时间的推移学习,做出更好,更自然的翻译。[1]GNMT能够一次翻译整句句子,而不是逐字翻译。[2][4]
历史
谷歌大脑项目于2011年由Google研究员杰夫·迪恩,格雷戈·科拉多和斯坦福大学电脑科学教授吴恩达在Google X秘密实验室成立。[5][6][7]吴恩达的工作令Google和斯坦福大学获取了突破。[8]
2016年9月,Google研究团队宣布开发Google神经机器翻译系统,同年11月,Google翻译停止使用其自2007年10月以来一直使用的专有统计机器翻译(SMT)技术,开始使用神经机器翻译(NMT)。[1][9][10][11][12][13]
Google翻译的NMT系统使用了一种能够深度学习的大型人造神经网络。[1][2][3]GNMT使用通过使用数百万更广泛的来源来推断出最相关的翻译,提高翻译的质量。然后将结果重新排列并组成基于人类语言的语法翻译。GNMT提出的系统学习架构通过Google翻译支持的语言进行了测试。GNMT没有创建自己的普遍语言,而是针对许多语言之间发现的共同点,因此心理学家和语言学家比电脑科学家对此更感兴趣。[14]2016年,Google翻译的其中八种语言开始尝试使用此系统,包括英语,法语,德语,西班牙语,葡萄牙语,中文,日语,韩语和土耳其语。[15]2017年3月,增加了俄语、印地语和越南语。[16]同月,因谷歌翻译社群的帮助下,添加了对希伯来语和阿拉伯语的支持。[17]2017年4月底,增加了9种印度语言的支持,包括印度语,孟加拉语,马拉地语,古吉拉特语,旁遮普语,淡米尔语,泰卢固语,马拉雅拉姆语和康纳达语。[18]
零点(Zero-shot)翻译
GNMT系统改进了以前的Google翻译系统,GNMT系统可以处理“零点翻译”,即直接将一种语言翻译成另一种语言(例如中文到日文)。以前Google翻译会先将源语言翻译成英文,然后将英文翻译成目标语言,而不是直接从一种语言翻译成另一种语言。[4]
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.