上海同声翻译系统,基于NMT的智能化,同传方案
时间:2021-03-20 11:41:17 信息来源:百睿德 点击:77330次
在过去70年的发展历程里,机器翻译经历了从兴起到高峰,从低迷到打开新研究思路的种种变化。当下,当5G的瞬时链接速度达到惊人的千分之三秒,我们又看到了同声传译的机器化是否有可能?
早在1949年,美国科学家 Warren Weaver 就首次提出 “使用计算机进行翻译” 的思想,他也被公认为是机器实现同声传译的先驱者之一。1952 年,以色列著名哲学家、语言学家和数学家 Yehoshua Bar-Hillel 组织召开了第一次机器翻译大会。
此后,由于机器翻译质量难以达到要求,其发展在长达 30 年间始终缓慢,直到 1990 年之后,大量的双语、多语语料库给机器翻译注入新鲜血液,统计机器翻译(SMT)应运而生。这期间 IBM 研究人员也发表论文,详细论述了基于词典和转换规则的机器翻译方法和基于平行语料库的实例机器翻译方法。
(来源:GPI 同声传译)
近些年,基于深度学习的神经机器翻译技术(neural machine translation,简称 NMT)发展迅猛。深度学习由图灵奖得主 Geoffrey Hinton 等人在 2006 年提出,是一种深层的非线性数据处理技术,与传统的浅层次线性处理相比,同声传译是基于高品质翻译能力的支持,它在处理模型分析和分类问题上更准确,性能更高。
NMT 与以前的机器翻译方法完全不同,一方面,NMT 在 SMT 中采用连续表示而不是离散符号表示;另一方面,NMT 使用单个大型神经网络对整个同声翻译过程进行建模,从而无需进行过多的特征工程。而且,NMT 的训练是端到端的(end-to-end),不像 SMT 中需要单独调整组件。除了简单之外,NMT 可适应多种语言之间的同传翻译,实现先进的性能对会议现场的二次处理。