中文| English

行业观察|翻译的未来

出处:未知   发布时间:2017-02-21 16:13:34   


互联网的迅速发展使得全球化的进程大大加快了。在此过程中,人与人的交往的方式也相应产生了变化,其中之一就是语言。现代社会语言的一个重要的特征就是简洁,只要能够达到交流的目的,语言的目的就达到了。


以前我们总是以很传统的信达雅来看待翻译。这个标准在 21 世纪似乎不重要了。但是翻译最基本的一条,即忠实原文还是必须的,否则会出现很“危险”的结果。


那么这就需要标准化。标准化能够保证译文的准确,尤其是行业术语的标准化。


回过头来看句子,在 20 世纪,人们似乎更偏好复杂的长句子。但是到了 21 世纪这个趋势正在减弱。由于生活节奏的加快,没有时间和耐心看长句子,大家更倾向于用简单的表达方式。把意思说清楚就行了。


拿英语来说,早就提倡 plain English,要求平白如话,不要在语言上拽文。这让我想起 1917 年 1 月著名学者胡适发表的《文学改良刍议》,自此拉来开了中国白话诗的新篇章。由于新诗的蓬勃兴起,汉语的变革也经历一场暴风骤雨般的变故,走得比较极端的就是汉语的拉丁化。不过这个运动终归没有进行下去,可是简化字的运动却迈的步子不小,虽然简化字直到目前依然有人持不同意见。就连两岸使用的文字都不一样。


字、词、句是每种语言的三种最基本的构成要素。《圣经·创世纪》中提到了人类多种语言的起源。可是人类语言的复杂性,正在成为互联网发展,乃至全球经济发展的桎梏。根据民族语言网( Ethnologue )提供的数据,目前全球正使用的语言多达 7100 种,但互联网网页上的语言只占其中的约 5%。甚至一些国家的官方语言,例如印地语和斯瓦西里语,也很少为互联网所包容。


那么如何解决这个问题呢?


肯定要靠翻译,海量的翻译,自动的翻译,滚动的翻译!专门有人做过研究,语言也是个势利眼的东西。那个国家的文化科技发达了,其语言就跟着发达,法语曾获此殊荣,德语紧跟其后,现在是英语正在风头。上个世纪曾弄出所谓的“世界语”(Esperanto),靠这种人工语言来达到无障碍的交流。可是,这一良好的规划彻底失败了,怎么办呢?


由于技术的发展,现在有了新的办法。计算机辅助翻译(CAT,computer-aided translation)就算一种。CAT 目前在各个行业中大行其道,例如翻译药品说明书、文件联机帮助和文档资料以及术语标准化程度高的文本。从事这项翻译的叫本地化服务,从业人员逐渐多了起来。


2009 年,中国翻译协会本地化服务委员会(简称“中国本地化委员会”)成立,这个领域的自此有了自己的专业组织。北京大学还专门成立全国首家“软件与微电子学院”,专门培养本地化人才。经过 10 多年的发展,本地化的工作已经走上正轨。需要强调一点的是,翻译软件是竞争的,但术语库却是排他的,例如某大公司需要做本地化工作,就需要它提供相应的术语库,经过翻译软件翻译,然后再进行人工校对成文。本地化属外包(outsourcing)的一种形式。我出钱,你出力,最后的成果是我的。


但是,本地化所完成的工作还是不过是冰山一角,远远无法满足需求。为促进不同地区之间的沟通,使全球各地区人群都能参与到数字经济中,翻译显得尤为重要。业内人士估计,目前全球翻译市场的年规模达到 370 亿美元。在新闻出版行业,国内外媒体和图书出版的交流正越来越火爆。在企业界,对各类报告、技术手册和合同文书的本地化需求也非常旺盛。因此在过去多年时间里,市场对翻译,尤其是优质翻译有着强烈的需求,陪同在国家领导人身旁的同声传译更是公众瞩目的焦点。然而与其他行业类似,翻译也正在被科技颠覆。


当前,翻译开始走出另外二条新的道路。


一是走向众包( Crowdsourcing ),它与外包的最大区别在于众包的核心包含着与用户共创价值的理念。众包的概念是由美国《连线》杂志的记者杰夫·豪(Jeff Howe)在 2006 年 6 月提出的。豪对“众包”的定义是: “一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。众包的任务通常由个人来承担,但如果涉及到需要多人协作完成的任务,也有可能以依靠开源的个体生产的形式出现。”


目前由包括 Facebook 和 Twitter 在内的社交媒体,正尝试通过众包模式实现网站提供其他语言的内容。而译言网等翻译平台也在利用众包的力量去提供其他语言的内容。不过,到目前为止,单纯的众包模式还不完全成功。毕竟,众包有点儿“非物质刺激”的因素在其中。


一是人工智能的发展推动了机器翻译的进步。在国外,许多科技巨头均利用人工智能技术去提供翻译服务,例如近期引人关注的 Skype Translator。在国内,百度、金山、网易有道、科大讯飞也都在开发类似的技术。人工智能翻译的发展尤其值得关注。目前,在谷歌翻译应用中,只需将摄像头指向希望翻译的文字,用户就可以立即获得翻译结果。到今年夏季,谷歌这一服务已支持 27 种语言的实时语音翻译,以及 37 种语言的文字翻译。谷歌软件工程师奥塔韦·古德在技术研发博客上表示,为了实现这一目标,谷歌收购了现实增强翻译应用 Word Lens,并利用机器学习和卷积神经网络技术去加强该应用,而图像识别是最关键的一点。即便是这样,人工智能不过是许多翻译技术公司正在尝试新模式,也就是在翻译众包的基础上加上人工智能。


这或许代表了翻译的未来发展趋势。人工智能首先完成最基本的翻译。在拿到来自机器的初步翻译结果后,众包的普通译者首先对机器翻译的差错进行更正。随后,高级译者将对翻译后文本的文学性和专业性做进一步修订。这样的流水作业将带来更高的效率,同时确保质量。


机器学习技术也会参与这一过程。通过机器学习,计算机将基于人工修订后的结果学到准确的单词表达,以及人类的语言习惯,从而优化未来的翻译能力。另一方面,计算机也会对人工翻译的“硬性”部分进行追踪,帮助译者避免低级错误。在这一过程中,人工智能和人工翻译将形成良性循环。


人工智能对人工翻译的帮助还不仅于此。例如,在众包译者工作的同时,人工智能将会了解不同译者具备的专业性。通过对这类数据的收集和分析,人工智能可以向不同译者分配他们擅长的翻译内容。例如,关于计算设备说明书的翻译将精准分配至电脑专家,而财务报告的翻译将可以由会计专业的译者来担纲。这种模式正在引起全球投资人的关注。例如,硅谷创业孵化器  Y Combinator 在2014年冬季班时孵化了这样一家公司 Unbabel。与传统人工翻译相比,人工智能的引入提高了效率,而不同于单纯的机器翻译,人工翻译使翻译的表达更准确、更流畅,更适合用于正式场合。


对于尚未被纳入互联网的少数族裔语言,这种模式将带来明显帮助。可以预见,通过统一的人工智能数据库,谷歌、雅虎、Facebook 等网站将自动翻译成非洲、南亚或印第安语言,而当地志愿者可以在此基础上高效的完成优化。这将消除互联网向贫穷国家普及过程中的语言障碍,成为真正连接全世界的“信息高速公路”。


原文来源:科学网刘钢博客