欢迎光临
我们一直在努力

Google Translate机器翻译错误的技术分析

几天前,还有另一场针对谷歌的所谓“侮辱性事件”。在一个着名的论坛上出现了一个帖子,呼吁网民“抵制谷歌的翻译工具”。这篇帖子指责了谷歌翻译工具中奇异的“张冠李岱”现象。甚至有些怀疑伤害了中国人的感情,以及谷歌的错误翻译。文章列举了一些例子,例如“我认为这很遗憾”(我认为这是一种耻辱)被翻译为“我认为这对中国来说是一种耻辱”等等。本文发表后,引起了很多关注,很多媒体都重印了它。之后,Google翻译翻译服务迅速纠正了此技术错误。由于我自己也使用谷歌翻译工具,我将结合我对谷歌翻译翻译工具的理解来解释这个错误的根本原因。在过去,翻译通常使用一个词进行“致命翻译”。由于词语含义的变化,同一个词在不同的情境中可能具有完全不同的含义,因此原始的翻译效果可以被描述为“灾难性的”。翻译质量普遍较差,基本没有参考价值,可以用暴君或雅虎翻译来翻译一两个英语进行实验。因为百度更了解中文,所以没有全文翻译产品,只有简单的单词翻译功能。谷歌翻译翻译服务目前是中文翻译领域最突出的。主要原因是谷歌翻译今年取得了创新,这使得谷歌翻译具有人工智能的意义识别能力,即通过谷歌同时搜索不同的词汇。同一网页的发生频率决定了单词之间的相关性,这种人工智能方法在真正意义上进行全文翻译。
在Google看来,单词的含义通常可以从与其一起使用的其他单词中获得。谷歌具有天然的优势 – mdash;一个被索引的大型数据库,通过比较大量的多语言数据,找到不同的语言。实现语法和文本对应规则以实现机器的自动学习功能。虽然谷歌的智能识别翻译大大提高了翻译质量,但总的来说,翻译水平无法达到很高的水平,而且一些技术错误是不可避免的。例如,此次发生此转换错误。我推测这个错误可能已经出现了。在谷歌的自动机器学习过程中,主要是学习一些西方文学及其翻译结果。因为西方对中国的评价大多是否定的,其中一些并不好。 “经常”这个词经常与“中国”一起出现。当发生的频率非常高时,Google根据过去的常识在这个“坏词”和“中国”之间建立了一定的关系,所以这已经出现了。智能炒作引发了所谓的“谷歌侮辱性翻译事件”。当然,这个技术问题并不难解决。它是扩展谷歌翻译的机器学习数据库,分析来自不同环境的一些数据(例如,还分析人民日报的信息),使得单词含义的偏差可能更小。结果将更加“中立”。一般来说,谷歌放弃了传统的翻译方法,并使用机器自动分析统计识别方法。这是一个很大的进步,大大提高了文章的翻译质量。 Google应该做的是优化识别统计算法并扩展自动学习数据库以使翻译结果更准确。
然而,令人费解的是,一些别有用心的人不会研究技术和算法问题,而是专门寻找一些奇怪的缺陷并将这个纯粹的技术问题提升到政治层面。早些时候,有“谷歌搜索南京大屠杀”,现在有“抵制谷歌翻译事件”。是的,有一种气味,哪里有苍蝇,苍蝇不能改变臭味,就像狗不能改变它一样。我建议那些专门寻找这种材料的人停止做一些令人着迷和耸人听闻的事情,不仅侮辱他们的智商,还要侮辱大多数网民的智商。今天的社会是一个竞争激烈的社会。有必要不断学习新知识和学习。它不仅是学习知识,更重要的是学习分析问题的能力和技能。如果你只知道如何建造一个自封的门并在闭门造车,你会想要一直考虑一些邪恶的技巧。如果你想提高你的知识和技能,你迟早会被这个社会淘汰。

未经允许不得转载:美国主机评论博客 » Google Translate机器翻译错误的技术分析

分享到:更多 ()