报道,在Google翻译项目负责人Franz Och在阐述google的统计式翻译时举例:

Google的翻译程序运用了统计学分析方法,Och希望这种方法可以避免出现外交辞令上的失礼,比如,当俄罗斯总统普京德国总理施罗德给打电话时,普京称施罗德是德国“Fuehrer”(德语:元首),普京的翻译顿感恼火,因为,在德语里面,这个词是专指希特勒的,属于禁忌词汇。Och说:“在我们的系统中,元首施罗德出现的次数绝对要少于德国总理施罗德出现的次数,因此,我们的翻译系统就会采用德国总理的称呼。”

但施罗德不是永远的总理。如果他下台了,机器根据统计数据仍然会称其为总理,而不会自动改口为前总理,直到前总理的出现频度足够高。

这个”慢热”问题在Google搜索引擎中也存在,表现为对新网站的评价和收录上。虽然,Google已经增加了很多指标,试图给新资料更高的分数,但仍不能彻底解决问题。又引发了沙盒效应。统计方法在搜索中不是万能的,在翻译中也不是万能的。

转载请注明来自:jijian91与小z - google

永久链接:http://jijian91.com/blog20070330/google-statistics-translation.html