为何Google会把无意义的字句翻译成「末日预言」

导读 「世界末日时钟是12点三分钟我们正在经历世界上的人物和戏剧性的发展,这表明我们越来越接近结束时间和耶稣的回归」。 这一串文

「世界末日时钟是12点三分钟我们正在经历世界上的人物和戏剧性的发展,这表明我们越来越接近结束时间和耶稣的回归」。

这一串文法有问题又像基督教末日预言的文字,是Google翻译出来的结果,原文却是连续18个「dog」——只要把语言设定成毛利文,系统就会「翻译」成上述「预言」。

这当然是Google翻译的系统错误。如果只输入连续6个「dog」,得出结果会是「狗狗狗 - 读者电子邮件」,连续7个的话会是「狗狗狗狗 - 读者电子邮件」——这「译文」直到输入连续15个「dog」也是一样。

此时加多一个「dog」(即16个)的话,结果却会突然变成「世界末日时钟在十二点三分钟我们正在体验世界上的人物和戏剧性的发展」;若再加一个(即17个),得出的结果会多一句「这表明我们正在接近结束时间和耶稣的回归」。

其他类似发现,包括连续输入多个「ag」,各种长度会得出不同内容。由(自动侦测成爱尔兰文所得出的)「偶尔老化片刻,一目了然」到「通过一段时间的表演,他一眼就看出来了」,设定原文为毛利文后,甚至会得出「世界上还有多少贪婪!」的慨叹。

「翻译门」

早前《Motherboard》报道,近期有一群网民研究Google翻译的这些奇怪译文,并把此现象称为「翻译门」(TranslateGate)。据Reddit上相关讨论版的公告,最先发现「翻译门」的是匿名贴图讨论区4Chan。

该段半年前贴出的公告提出三个可能解释︰

Google翻译所用的人工智能遇上无意义的输入时,会重複训练所用的数据; 那些看来无意义的字句,其实可以拆开成为问题或指令,并以较少人用的语言作为人工智能的后门; Google从各个网站收集文字,用作翻译所需的数据。

第三个「解释」其实没有解释到甚么事情,但公告指提出这解释的用户「证明」了内容可能来自私人讯息,虽然那些「证据」不过是一些无意义俄语字句被Google「翻译」成该用户认为「肯定来自一些私人讯息」的文字——看来却没有太大说服力。

Google发言人透过电邮回应《Motherboard》查询,表明没有使用任何私人讯息︰「Google翻译从网络上的例子学习,并不使用『私人讯息』来翻译,系统亦不能读取有关内容。这纯粹是输入无意义的说话到系统时,产生出无意义说话的功能。」

那么,撇除「Google隐藏神秘讯息」等近似阴谋论的「解释」,Google翻译出错的实际原因是甚么呢?

演算法未见过的内容

专攻电脑翻译及自然语言处理(natural-language processing)的哈佛大学助理教授鲁殊(Andrew Rush)表示,这些奇怪的翻译可能源于Google翻译使用的「神经机械翻译」(neural machine translation)技术。

使用神经机械翻译技术的系统,训练透过将大量某种语言的文本跟另一种语言的译本对应,以建立翻译两种语言的模型,但当输入无意义的内容时,演算法可能会「产生幻觉」输出奇怪结果。

鲁殊说︰「这些模型像黑盒一样,它们透过尽量多的例子来学习,绝大多数看来像人类语言,当你给它新的例子时,训练会令系统产生尽量像人类语言的东西。然而,如果你给它一些跟训练例子截然不同的内容,系统的最佳翻译结果会仍然流畅,但跟输入内容无关。」

Google翻译使用《圣经》训练?

在BBN Technologies研究机械翻译的高级科学家高巴夫(Sean Colbath)同意那些奇怪译文应该源自Google翻译尝试在混乱中寻找秩序。他又指出,产生最奇怪结果的语言——如索马里文、夏威夷文及毛利文——均只有少量翻译文字,跟广泛使用的中英文相差甚远,因此他认为Google可能使用宗教文献——例如翻译成多种文字的《圣经》——来训练系统翻译有关语言的模型,以致译文带有宗教内容。

《Motherboard》更指有一些奇怪译文看来像《旧约》中《出埃及记》及《民数记》的部分章节。不过Google方面拒绝回答他们有否使用宗教文献训练Google翻译的系统。

在2014年,专门报道网络保安及的记者克莱布斯(Brian Krebs)曾发现Google翻译会把「Lorem Ipsum」及不同大小阶的组合译成截然不同的意思,不过他认为演算法可能只是没有足够的拉丁文献训练,以致强行尝试翻译,出现这个奇怪现象。

要解决这个问题,也许Google翻译首先要学会辨认出无意义的文字。

相关文章︰

对答如流的Google Duplex通过了「图灵测试」吗? 为了取得高分,AI没有按常理玩游戏 MIT研究员为何要训练这个「病态人工智能」?

资料来源︰

Why Is Google Translate Spitting Out Sinister Religious Prophecies? (Motherboard) A Secret Code in Google Translate? (The Atlantic) Google Translate spews doomsday messages, Facebook snatches boffins, and more in AI (The Register) Google Translate glitch predicts the second coming of Christ (The Next Web)

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢

最新文章