微软的同声翻译软件能否替代人工？


	微软的同声翻译软件能否替代人工？

	2012年11月26日，据博文深圳翻译公司最新动静，微软首席研究官、微软研究院院长里克·雷斯特博士在天津举办的“21世纪计算大会”中展示的微软最新的研究成果——同声传译，向众人描绘了一幅“跨越语言，沟通无碍”的夸姣蓝图。 ■速度只比原声慢半秒在美国热播了40年的科幻电视剧《星际迷航》中，有一个非常“打眼”的工具——宇宙翻译器。星际舰队成员把它别在胸前徽章里，整个星际联邦都广泛使用它将所有的已知语言翻译为听者所懂的语言，对其余的未知语言也可通过对简短几句话的分析而进行转换。按照剧中设定，宇宙翻译器要到22世纪才能发明。不外，在雷斯特的设想中，这种翻译器的泛起可能不用等那么久，他日前展示的“同声传译”就是通往宇宙翻译器的重要一环。在这个10分钟左右的演示中，雷斯特一直中速讲英文，他背后有两个大屏幕。现场观众都看到其中一个屏幕把他讲的话以英文文本的形式展示出来，速度大概只比他的声音慢小半秒。在另一个屏幕上，上半部把英文文本中的单词提掏出来，并对应中文单词，而下半部按照中文语序已经排列成中文句子。随后，最令人激动的时刻到来了，翻译完的中文句子以普通话的形式“说”了出来，声音听起来与雷斯特本人很像，速度基本上是他一说完英语，机器就“说”出仿真声音的中文翻译，听起来就像雷斯特在给自己做同声传译。他表示，微软的同声传译不仅能英译汉，还能翻译西班牙语等26种语言。固然目前还没有走出实验室，未来却可能做成同声传译器，以至有人惊呼学同声传译的人岂不是要失业么？ ■语言识别并未完美这个吸引眼球的演示第一步就是用计算机识别雷斯特的英文发言，但是这可能也是最难的一步。雷斯特先容，最开始的语言识别采用简朴的模式匹配，计算机检查语音产生的波形，并尽量与已知相关的特定单词相匹配。不外这一方法失效率太高了。直到七八十年代，隐式马尔科夫模型（HMM）被广泛应用，它利用来自多个人的培训数据建立更为稳健的统计语音模型，成为语言识别的主流。不外，直到本日，即使是最佳的语音系统，在任意语音上的单词犯错率还高达20%-25%。 “两年前，我们和多伦多大学的研究职员使用一项名为深度神经网络的技术，仿照人脑行为，语音的错误率比之前的方法降低30%。这意味着之前四五个单词中就会泛起一个错误，而现在七八个单词中才会泛起一个错误。” 固然微软同声传译的技术细节仍未透露，不外声学专家解释，这一技术仍是建立在HMM的框架上，改为用神经网络模拟语音特征分布，从八九十年代就有应用。只是现在计算能力进步，能把模型做得更细，也就更“深度”。这种方法的正确率与数据积累有很大关系。计算机越来越多地学习、把握更多数据，就会更智慧，这就是“机器学习”，不外机器学习依然有限度。假如是针对专人的优化“学习”，语言识别的机能会进步得多一些。 ■机器翻译能代替人工翻译？说话人的语言被识别了，如何英译汉也是个大题目。数据显示，近几十年来，因机器翻译质量存在题目，一直无法成为翻译的主流。我们常常会使用软件翻译页面，所得文本之凌乱不问可知。雷斯特表示，他的演示中英译汉需要两个步骤：“第一步是提取我说的单词，然后找到相应的中文，固然这并不简朴，但确实是比较简朴的一步。第二步是重新调整单词的顺序，使之符合中文习惯，这是语音准确翻译的重要一步。” 雷斯特所说的步骤与目前机器翻译的方法是一致的。难点就在于译文选择和调序，不同语言语序不同，一个词翻译成另一种语言也可能有多个候选译文，所以机器翻译结果有时漏洞百出。现有进步准确率的方法需要依赖统计学。雷斯特也承认，微软的同声传译在文本方面还有良多错误，而且翻译结果可能很搞笑。不外，统计技术和大数据的引入将使文本翻译有翻天覆地的变化。然而，有专家以为，机器翻译只能在某个特定领域达到较高的正确率，好比法律或经济领域能达到80%到90%的正确率，这是由于在特定领域词义有了明确界定。而在通用领域，机译正确率不会很高，仍是要依靠人工翻译的经验。 ■模仿的声音有多像？ “数年后我但愿打破人与人之间的语言障碍。”当雷斯特用英语说出这句话一秒钟后，微软同声翻译机模仿他的声音用中文说出。台下的观众报以强烈热闹的掌声。确实，假如能在翻译中留存说话人的语调，交流将会更顺畅。雷斯特说：“我这个不会说中文的人以自己的声音‘说’出中文其实令人高兴。”而要达到这一效果，需要一个文本到语音的系统，包含数小时中国人说话的语音。此外，他还要预先录制1小时的英文语音数据用来提取自己的声音属性，最后得到仿佛自己在说中文的效果。这是一个个性化语音合成技术。一般情况下，机器通常只需模仿固定的男女两种声音，而要得到针对专人的仿声，则需要获得他/她的语音数据，提取发声相关的特征参数，好比节奏、频率、语气，也就是专业术语说的基频等等。当合成系统适应后，就可以输出仿真声音了。不外，模仿声音无法做到以假乱真，应该只能做到七分像，由于模仿只能把一个人的习惯在单调水平上重现。好比，可以通过一个人走路的习惯、步长、左右扭捏等正确模仿他的行走。但是人讲话的信息量太大，固然理论上可以分析节奏、频率，但是要完全量化技术上仍是做不到。【温馨提示】如您遇到翻译难题或者有翻译需求，可立即拨打博文翻译公司报价全国免长途费咨询热线：+86-755-8304 2538（一生我帮您！）我们为您提供解决方案，更多详情请浏览：博文翻译公司品牌网站：http://previous.bowwin.com/ 博文翻译公司产品网站：http://www.4008813580.com/

中国互联网信息服务业务许可证号:
粤ICp备05036433