法汉机器翻译中多义词翻译策略
作者:佚名; 更新时间:2017-01-29

  早在1949年,Weaver发表的以《翻译》为题的备忘录中就提出:“当我阅读一篇用俄语写的文章的时候,我可以说,这篇文章实际上是用英语写的,只不过它是用另外一种奇怪的符号编了码而已,当我在阅读时,我是在进行解码。”[1]15-23这实际上就是基于信源信道思想的统计机器翻译方法的萌芽。近年来,随着越来越多的研究人员投入到统计机器翻译的研究中,各种统计翻译模型不断涌现,取得了不小的成功。

  近几年,机器翻译从原来的基于词的翻译逐渐演变至基于短语的翻译,以及对多义词词义的选择性运用,这使得翻译的准确性和合理性都有了一定的提高。但目前机器翻译主要存在以下问题:词义选择问题、短语识别问题、歧义消解问题、句法结构处理问题、文化因素问题、未登录词识别的问题等等。中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出的:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的。[2]328-343目前,国内市场上法语翻译软件的操作程度、翻译准确性、可读性等都不理想。大多数翻译软件的法汉互译都是以英语为中介语,这忽视了法语本身的语言特点,反而有可能增加了翻译难度。因为虽然英语和法语在句法和语法上比较相似,但英语的句法更为灵活,而法语的句法和语法则十分严谨,歧义的表达比较少。因此,用英语作为中介语处理法汉翻译会增加翻译难度,降低翻译质量。

  如今,国外有很多政府机构、企业和大学都有自己的翻译实验室;市面上也有一些大型的翻译软件,如DéjàVu,Systran等,可以在多种语言之间进行互译。但对于同时具备复杂性与普遍性的多义词而言,在不同语境下对其词义的把握,仍是现今机器翻译所需要攻克的重要难题。

  一、多义词翻译的重要性

  词是组成句子的要素,并且通过语法将其整合成一个完整的句子,因而词义对于一个句子的翻译来说至关重要。多义词是法语中一种普遍现象,即一个词同时具有多种意思。

  在机器翻译过程中,从多个意思中选择一个符合语境的词义,是现今机器翻译所面临的一个难题。目前的机器翻译都以句中词的基本意思来翻译,而我们的翻译设想则是以语境决定词义的思想为核心,依据句子语境对词选取最合理的解释,再根据中文用词的习惯特点进行整合。这就需要我们对词的意义进行细致并且系统的研究,对词义附上具体的使用语境。

  一个单词的语法功能、语义、语用等都有可能造成词的多义现象。例如单词兼类,即同一单词具有两种或两者以上词性;单词在同一词类中,却表达几个不相关的概念;同一概念在不同的上下文或短语中的不同意义,等等。这些多义现象的存在,增加了翻译系统的错误率。

  如在google在线翻译中,当输入“Lemaraudeurestentraindecasserlaserruredecetteporte”,谷歌在线翻译的解释为“掠夺者是要打破门的锁”,而本句话的原意应是“小偷正要砸门锁”。maraudeur在这里应该解释为“小偷”的意思。

  再如,当输入“Ceciestsimplementnaturel,sanslemoindreef-fort.”,谷歌在线翻译的解释为“这是很自然的,没有任何努力”,而句子的原意为“这是种本能,不费吹灰之力”。naturel一词在这里不再解释为“自然的”,而应为“本能的”。

  有调查显示,通过612个法语名词短语的翻译比较分析,就发现了48个名词多义引起的歧义现象,30个生硬异常的翻译,26个错误的翻译以及508个正确的翻译。[3]226-235这种名词多义引起的翻译问题因为涉及话语分析领域,必须通过上下文语境中的关键词出现频率来选择合适的释义。由此我们可以得出,多义词在翻译中所产生的重要影响,准确把握多义词词义对翻译的准确性有着重大意义。

  二、语料库的选择和语料的整理

  机器翻译又称自动化翻译,是应用语言学中的一门新兴的实验型学科,研究如何利用电子计算机按一定程序自动进行自然语言的翻译问题。机器翻译的结果好坏,往往取决于译入语跟译出语之间,在词汇、文法结构、语系甚至文化上的差异。要改善机器翻译的结果,人为的介入相当重要。

  我们应该尽量避免机器翻译对一词多义的词语自动采取主要词义逐字逐句翻译的偏向,使机器翻译可以依据上下文所涉及的特定领域或相关社会事件。我们可以通过一定的数据统计技术分析,优化词义选择步骤从而,实现更为合适的翻译结果。为此,我们选择了上海译文出版社2001年8月出版的《新法汉字典》修订本作为语料。此部词典对词语的解释不仅包括多义词汇的一般性含义,还包括经济、法律、电脑、信息科学、生物工程等领域的特殊含义;词典收录了社会新生词汇,同时也删去了某些词汇陈旧的或是在当代已经不再使用的含义。此部词典容量较大,共收约六万五千个词,其本身对广大法语学习者、使用者有很大的参考价值,可以为读者在平时的翻译过程中提供中肯、更精确、贴近实际的参考。

  对于语料的处理,本文采用理论分析与实际研究相结合的方法。我们将词典中一词多义的词汇的中文意思进行分类整理,即将每个词语的所有词义按照不同专业领域或类别、词性进行分析分类,通过小组的方式进行筛选从而建立一个小型语料库,其形式如下:

  在此词的含义里,除了最常见、最主要的含义“部分”外,同时可以发现它还有诉讼、游戏、运动、数学等领域不同的概念。因此应该根据不同的汉语语境选择相应的词义。通过提供每个词的主要语境来判断该词的具体翻译,如“ordon-nance”,若上下文中有“药店”、“医生”等词时译为“药方”,而上下文中有“军队”、“士兵”时则译为“令兵”。然后,通过自建的小型语料库对法语多义词义项及其语法信息进行小规模统计研究。分析每个词义在使用过程中所处的语境,从而得出更为合适、准确的词义,以及将词义与汉语语言使用习惯、语法功能、语义、语用相对照,达到更为自然妥当、可读的翻译。在此实践基础上,总结出一定的规则,再用规则反过来检验实际的语料,以证明本文研究成果的可靠性和有效性。此外,我们通过问卷的方式,调查法语教学者对本文研究成果的认可情况以及其是否能促进法汉机器翻译的发展。

  三、结语

  国内对英-汉和汉-英的机器翻译研究较多,而对法-汉、汉-法机器翻译的研究则少得多。冯志伟于1987年建立了法汉机器翻译FCAT系统,但因为复杂的句子结构而没有得到进一步发展。[4]现有的机器翻译还不能很好地满足当今社会对法语翻译的需求,纵观现有的翻译方法和软件,其对于句子的翻译大多还只停留在逐字逐句的翻译阶段,常采用词语的主要义项来解释,而这样的翻译常常会导致句意不通、翻译出的句子无法理解等情况。因此,对句中的词如能做到依据具体语境来翻译,就可以更好地避免类似情况的发生,翻译质量会得到一定的提高。本文是对多义词的研究,其预期的成果为法语多义词词典及其词义识别规则。这是对法语的理论创新性研究,可以为法汉机器翻译的新策略提供语言学基础。本文的研究成果可以在法语教学中进行广泛的应用。此外,英汉机器翻译也可以用法语作为中介语,进行另一种尝试。

  对浙江省而言,浙江省与世界上很多法语国家和地区有着广泛的交流,尤其是有着频繁的贸易往来。但浙江高校的法语教学起步较晚,目前开设本科阶段法语专业的公立大学只有浙江大学和浙江工商大学,浙江外国语学院从2012年开始招收法语专业本科学生,浙江传媒学院设有法汉双播相关专业;其他高校一般设有二外法语课程(面向英语专业学生)或全校法语选修,法语教育事业正处于发展阶段。因此,不论是从国家宏观角度,还是从浙江省的角度来看,法语的发展都是必须的。而法语机器翻译的发展也是不容忽视的重要部分。而要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题。若单靠若干程序来做机译系统,肯定是无法提高机译质量的。我们着眼于研究法语中的多义词以期为法汉机器翻译提供坚实的语言学基础,促进改善法语机器翻译的效果,通过提供每个词的主要语境来判断该词的具体翻译,由此对机器翻译起到一定的理论创新作用和实际应用价值。

  【参考文献】

  [1]W.Weaver.1955.Translation(1949)[C]//MachineTranslationofLanguages.MITPress,Cambridge,MA.

  [2]周海中,黄国文.机器翻译五十年[C]//语文研究群言集.中山大学出版社,1997.

    核心期刊快速发表
    Copyright@2000-2030 论文期刊网 Corporation All Rights Reserved.
    《中华人民共和国信息产业部》备案号:ICP备07016076号;《公安部》备案号:33010402003207
    本网站专业、正规提供职称论文发表和写作指导服务,并收录了海量免费论文和数百个经国家新闻出版总署审批过的具有国内统一CN刊号与国际标准ISSN刊号的合作期刊,供诸位正确选择和阅读参考,免费论文版权归原作者所有,谨防侵权。联系邮箱:256081@163.com