标题:免翻墙使用谷歌翻译
作者:
日期:2016-10-02 22:46:27
内容:

原题:谷歌新版翻译有多神?英文教授亲证后告诉你...

谷歌翻译http://translate.google.cn/

  旦旦

  9月27日,谷歌推出了新的翻译系统,声称该套翻译系统基于对人类神经思考的模仿,能够与真人翻译竞相匹敌。众所周知,将汉语恰 切地译介为英语是一件不易之事。输入中文,翻译系统给出的答案往往是“惨不忍睹”,简单的机械翻译对于那些谷歌翻译的依赖者来说已远远不够。在谷歌发表的 题为《规模生产中的神经网络机器翻译》的文章中,宣布将机器学习技术纳入网页和手机APP翻译中,从前汉译英的尴尬局面将大为扭转。谷歌公司称,相较之前 的算法,谷歌神经机器翻译能减少80%的错误,与通过标准测试的真人翻译所差无几。

  那么,谷歌中译英新版是否真的有这么神?金雯教授亲自进行了测试,她得出了这样的结论...

  谷歌中译英新版凌厉登场,“神经网络翻译”和机器学习等字眼引动了许多不彻底的欢呼和不确凿的惶惑。

  我不懂机器学习技术,但我对它是友好的,况且我懂中文和英文,理解翻译这件事。所以我也就不避纷扰,来发表一些我个人对于Google Translate目前中译英水平的观感。

  首先,谷歌翻译功能不需要翻墙,在国内也可以用,所以以下我说的内容,大家都可以重复验证,并提出自己的观点。谷歌翻译的网址:translate.google.cn 可以选择中译英的设置,因为中译英功能是这次谷歌技术的突破点。

  

  我的总体感受:

  谷歌中译英对写得像英文的中文句子比较能应对自如,就是那些主语谓语宾语等成分清晰的句子。尤其惊艳的是对于包含两三个短句,当中用逗号连接, 逻辑关系清晰(即西化)的中文句子,谷歌翻译能够正确识别何为主句,何为表达因果、伴随状态的状语从句。当然,对许多四字成语和俗语(如“梁上君子”、 “图样图森破”等)也有备而来,至少在单独出现的时候能够识别并正确翻译。

  这也就是说,谷歌中译英比较适用于一板一眼的中文,比如写得干涩而又十分清晰的科学论文和人文社科类论文(即便是这类论文,也会出现机器无法处 理的长难句),或许也适用于一部分新闻社论。这类中文用谷歌翻译成英文后,经人工修改把关,问题就不大了。这样的确可以节省许多初级、机械的翻译人工,对 翻译生产力是一种解放。至于会不会引发大量翻译失业的问题,还不能就此作出判断。

  然而,谷歌中译英对于大部分散文作品、日常电邮交流(可能有官话,可能有省略式表达)、口语化的生动表达、诗词曲艺、文字游戏等,都还只能望洋兴叹。而且,我发现,即使是谷歌认识的短句式和俗语,出现在有些复杂蜿蜒的句子中时,也会让谷歌犯迷糊。

  中文与英文也有许多不兼容的地方,有自己独特而狡黠的语法。况且,自然语言是灵动的,不论中英文,写的灵动的时候都是不机械,不容易理解的。对 语言的灵动,机器目前是无能为力的,不知未来如何。还是希望研究语言文学的人与科技界人士多多交流互补,虽然主力军还是人工智能人士。

  有的人说,为了使用谷歌翻译,可以将自己的中文句子写成机器可以辨认的样子。这个技巧当然是没错的,为了论文能够顺利快速地翻译成英文,也不失为一个权宜之计。可是这项技术不应该是为人服务的吗? 如果让自然语言削足适履,科技就真的变成禁锢人类语言才华的枷锁了。

  下面就具体地谈谈谷歌中译英功能的一些问题,由此也可以发现许多自然语言的奥秘和中英文差异。

  1

  主语的问题

  汉语中主语的位置非常灵活,也往往会在句子中省略,这会给机器带来不少困惑。而且,如果主语比较长,本身就是一个词组(这种情况中英文实际上都有)的话,谷歌翻译就更加吃力。例证如下:

  01

  原句:您预约的馆际互借图书已到馆,请尽快至闵行图书馆馆际借书处取书。

  机器翻译:You have booked the interlibrary loan book has been to the Museum, as soon as possible to the Minhang Library Interlibrary borrow books from the book.

  正确翻译:The interlibrary loan book you ordered has arrived at the library. Please come as soon as possible to the Minhang Library to pick it up.

  解析: “你预约的馆际互借图书”是用一个词组做主语,机器还没明白,以为“你” 才是主语。而后面的半句里主语省略了,在机器的翻译中也就发生了句子残缺不全的情况。

  02

  原句:这本书只好去网上买了。

  机器翻译: This book had to go online to buy.

  正确翻译:I will have to order this book online.

  解析: 这个句子的主语缺席,可以是“我”,也可以是“你”,要看语境,但机器以为主语是“这本书”。(另外还有一个问题,那就是机器默认的时态是过去时,而原句实际上是将来时,机器还不能辨认。)

  03

  原句:你想看的电影已经上映。

  机器翻译:You want to see the film has been released.

  正确翻译: The film you want to see has been released.

  解析:机器又以为主语是你,而不是电影。

  2

  动词的问题

  汉语中经常出现用形容词或形容词词组做动词的情况,对谷歌是一个挑战。

  例证如下:

  01

  原句: 桃红柳绿。

  机器翻译:Pink willow green.

  正确翻译:The peaches are red and the willows are green.

  解析:机器直接懵了。

  02

  原句:谷歌新技术面世。

  机器翻译:Google’s New Technology available.

  解析:谓语“is”缺少。

  03

  原句:北京近日多雨。

  机器翻译:Beijing recently rainy.

  解析:(同上理。)

  04

  原句:肉熟了。

  机器翻译:Meat cooked.

  正确翻译:The meat is cooked.

  解析:这里不仅动词缺少了,冠词也没了。中文里不用冠词,所以谷歌不知道这里应该加The,这个问题需要比较高水平的人工译者来纠正。

  3

  时态的问题

  机器很难确定一个中文句子实际上表达的是什么时态。默认的是过去时,有时候也懂得用一般现在时,但总体比较机械。例证如下:

  01

  原句:他不相信。

  机器翻译:He did not believe it.

  原句:他不相信世界。

  机器翻译: He does not believe in the world.

  这里我要表扬谷歌翻译,它正确地判断出第一句是过去时,第二句是一般现在时,令我惊叹!

  02

  原句:一星期前我回家了,第二天就有小偷来摸索北房的铁丝窗。

  机器翻译:A week ago I went home, the next day there is a thief to explore the north room of the wire window.

  解析:第二个短句应该也是过去时,但机器用了现在时,不明白要与前面一个短句承接的道理。

  03

  原句:他回想起过去的三年,不禁有些悲凉。

  机器翻译:He recalled the past three years, can not help but some sad.

  解析:道理同上,第二个短句也应该是过去时。

  4

  灵动的散文句子

  对于这些句子,机器还没有学会解读。其实在人工翻译中,这类句子也是最难翻译的,要用既符合英语语法,又精炼灵巧的方法译成英语,非常困难。以前我上高级英语课,会讲一点这类散文句子的翻译。

  01

  原句:北京近日多雨,你在长安道上不知也遇到否,想必能增你旅行的许多佳趣。(周作人《苦雨》)

  机器翻 译:Beijing recently rainy, you do not know Chang'an Road, also encountered no, must be able to increase your travel a lot of good fun.

  解析:谷歌翻译彻底没辙。这属于不能看的英文句子。不知所云。

  02

  原句:他自小受家庭影响,不爱说话。

  机器翻译:He was affected by family, may not talk.

  解析:在这里,谷歌翻译没弄明白后面一个短句是一个结果。如果把这句中文改成:因为他从小受家庭影响,所以不爱说话,那么机器应该是可以理解的。当然,有人要说了,我凭什么要改的这么累赘。

  03

  原句: 他回想起曾经为他做的事,觉得自己实在委屈,又没处申诉,便郁闷起来。

  机器翻译:He recalled what he had done for him, feel that they really wronged, and no place to appeal, they depressed.

  解析:同理,句子各部分之间的逻辑关系谷歌翻译没有弄明白,这个句子缺乏表示逻辑关系的连词,各部分的语法关系不明确,所以对机器构成挑战。

  5

  古诗词

  01

  原句:青鸟不传云外信,丁香空结雨中愁。

  机器翻译:Bluebirds do not pass the letter of the cloud, cloves empty knot rain.

  解析:前半句语法还比较清晰,谷歌翻译还可以勉强为之,后半句的“空”不符合一般语法要求,所以机器对后半句是完全崩溃的。

  6

  “比较”这个词

  01

  原句:我感到比较郁闷。

  机器翻译: I feel more depressed.

  解析:中文里的‘比较’不一定要和其它东西或人比,就是表示一种中间程度。而英文里一定是两相比较。这是中英文差异的一个小小侧面,是英语学习者的难点,也是机器翻译的难点。

  我的测试当然不完全,但是足以说明,机器翻译的难点和人工翻译的难点有不少重合的地方,人觉得难的,机器也一样不会处理。但机器在处理简单翻译任务的时候比初级水平的人工译员要可靠,这大概就是机器的神奇之处吧。

  祝谷歌翻译前程似锦,而我们人类也会不断磨砺翻译和语言能力,与机器联手,既深刻地参透语言的规律和秘密,又超脱不羁地使用真正活着的语言。

  (本文也同步发于文汇客户端。)

  (金雯,华东师大教授,美国西北大学博士,2006-2013年在哥伦比亚大学教授核心课程“西方文学史”,“美国文学史”和“亚裔美国文学史”。也可关注金教授的微博或豆瓣(莫水田)获得更多的信息。)

  


返回列表 网站首页