就是这个道理。当然,信仰影响一个人、一个组织、一个民族、乃至整个人类的命运也是这 110 个道理。一个学科的发展又何尝不是这个道理呢?例如:高等教育学,又如:普通信息学, 再如:普通语言学,它们都是国际理论学界公认的缺乏学科内在建制的研究领域,尽管三者 的外在学科建制均已经都是发展的相当可观的庞大建制。三者看似风马牛不相及的具有很大 跨度的研究领域,其实,在学科的内在建制问题上所遭遇的却是性质一样的难题,都是研究 对象不确定,或者说,太大、过于模糊而难以具体把握。根据笔者多年的研究以及学术交流 115 探讨的体会,三者均面临一个更为根本的难题,即:如何在“显而易见”或“视而可见”与 “非显而易见”或“显而难见”或“视而不见”之间建起一系列相互连通的“桥梁”?它在 本质上就是一个如何从P≠NP 经过P≈NP 逐步逼近P=NP 最终趋近P≡NP 的过程。 明眼人一看就知道它是一个超级难题。它就是计算机科学计算复杂性研究领域通常所说 的NP 完全问题。它的确是一个国际超级难题。虽然已发现数以千计的P=NP 的具体例证, 120 但是,仍然不能证明P=NP 的一般结果。因为,除非穷举,否则,就是用再多的例的归纳 也不足以证明类的结果。类的完整演绎可以证明它,但是,要做到与例的实际结合且有意义 也算是一件很难的事情。 由此可见,仅靠确信或仅有置信假设,而没有具体的取值或每一步取值判断,是不行的。 机器翻译策略即机器翻译金字塔模型所依据的基本假设中隐含悖论是一个典型的例子。 125 与仙农齐名的著名学者韦弗最初提出的机器翻译策略就是设想:用一个中间语言来建立 原文与译文之间的桥梁关系[6]。这就是机器翻译金字塔模型想法的最初渊源。后来的学者很 少对这样的信念进行质疑。换句话说,人们都投身于具体的算法和形式化处理技术之中几乎 不再质疑机译的总体策略——机器翻译金字塔模型,更别说再进一步质疑语言学研究对象 了。 图3 直译和转译的金字塔模型原理图 由图3可见,直译和转译的金字塔模型,即:一般的机器翻译策略,笔者在其上下加注 了a=b 与a≠b 两个代数式,旨在揭示其中蕴含这么一个基本假设,即:在原文(a)和译 135 文(b)之间存在一个中介文本(c)。就是说,本来没有联系的原文(a)和译文(b)通过 共同的中介文本(c),则可建立互译的等价关系。这就相当于说,虽然a≠b 但是因为a =c 且b=c 因此可推导出a=b 的结论。但是这个推理链条在此存在一个严重的逻辑问题。 仔细推敲,读者也不难发现以上这个推理过程之中隐含着a≠b 且a=b 这样一个悖论。 这么严重的一个逻辑问题,机器翻译学界竟然长期视而不见。为什么会这样呢?其中, 140 除了感情和利益以及社会影响等复杂的其它因素之外,笔者认为:影响学界做出理性判断的 基本因素主要就是价值判断(复杂的社会文化价值和简单而抽象的逻辑真值)和置信假设。 以英语和汉语为例重新分析普通语言学的研究对象 普通语言学的研究对象究竟是什么?或者说,什么是语言?它主要指什么?可否进一步 区分为言和语?为什么不能在英语的言与汉语的言之间划等号? 145 索绪尔尝试性地回答了前面三个问号,他不仅区分了语言和言语,而且,还指出语言是 一个价值系统,进而,他系统分析了其中音义结合的词素、单词、词组、句子等结构单位。 从而开创了科学地探讨语言学的先河。汉语的情形很特殊,例如,在文言中就根本没有印欧 系语言的词素、单词、词组、句子那样的结构单位,只有偏旁部首、字、辞、链、块、读、 句这样的结构单位。又如,白话文及现代汉语引入印欧系语言的结构单位却造成了多次本位 150 转移或本位之争,其中最典型的是马寅初、黎景熙、朱德熙和徐通锵等人的本位学说。我们 提出“言”和“语”两个系列的细分价值系统,指出两者的区别在置信而联系却在取值。 例如,假设英语的言是词,汉语的言是字,那么,英语的语就是词组与句子,汉语的语 则是字组1(即:辞、链、块)与字组2(即:读、句)。如果从普通语言学的基本研究对象 “言”及其取值角度看,那么,说英语与说汉语的社团可视为对英语的言即词与汉语的言即 155 字分别置信的社团。同理,如果从普通语言学的派生研究对象“语”及其取值角度看,那么, 说英语与说汉语的社团可视为对英语的语是词组与句子而汉语的语是字组1(即:辞、链、 块)与字组2(即:读、句)分别置信的社团。这样,我们就可以得到以英语与汉语为例的 普通语言学研究的言和语两个系列的细分价值系统,即:作为基本符号对象的普通语言学的 基本研究对象“言”及其取值与置信的细分价值系统;而作为符号组合解释的普通语言学的 160 派生研究对象“语”及其取值与置信的细分价值系统。由图1可见以汉语为例的普通语言学 研究可区分两类具体的基本研究对象,然而以英语(或其它印欧系语言)为例的普通语言学 研究却必然遗漏文言的字这样的研究对象。鉴于白话的词属于外来或引进的语言结构单位, 故被纳入区别于字的另一类语言结构单位。在以汉语为例的普通语言学的研究对象之中,言 具有基本结构单位的地位,简称:言本位。用这种基本的语言观,不仅可克服以汉语为例的 165 普通语言学研究中其它几种本位说的错误、缺点或不足,而且,还可为以下崭新的机译策略 奠定语言理论基础,并且也可为语言学迈向语言科学进一步发展奠定形式化处理的基础。 以英语(a)和汉语(b)为例,其中,词(a1)与字(b1)分属英语和汉语各自的基本 研究对象,由于基于字母的词(a1)和基于笔画的字(b1)分属截然不同的两套符号体系, 因此,可以验证两者作为各自具体的对象语言分属两个不同的符号类,即a1≠b1 是事实;而 170 词组(a2)与字组1(b2)或语辞、句(a3)与字组2(b3)或语句分属英语和汉语双方各自 基于言的派生研究对象——语,由于双方均可表述相同的思想概念或指称相同的世界物象, 因此,也可验证两者虽然分属各自不同的符号的组合,但是两者作为解释语言却是等价的, 即a2=b2 以及a3=b3 均可成立,考虑不同语言共同体的文化差异,退一步考虑,至少我们可 视之为是相似的,即a2≈b2 以及a3≈b3 均可成立。也就是说,我们假设对象语言a1≠b1 是 175 事实,同时,假设解释语言a2≈b2 以及a3≈b3 均可成立,也可是事实。 我们知道,只要a1≠b1 是事实,a≠b 必然也是事实。这不难证明。同时,只要a2≈b2 以及a3≈b3 可成立,a≈b 自然也可成立。理论上就不会陷于a≠b 且a=b 这样的逻辑悖论。 图4 一个崭新的机器翻译策略——更加适合双语者和计算机辅助计算或统计编译之间协作原理图 180 由图4 可见,基于双语处理而设计的“解释+翻译”模型是一个崭新的机器翻译策略。 了解并熟悉基于统计的机器翻译工作者或细心的读者不难发现,这种新策略实际上已在某种 程度上被基于统计的机器翻译系统所采用。例如,大规模的双语平行语料库实际上所采用的 就是图4所述策略的第②阶段采用的策略。又如,基于实例的机器翻译和翻译记忆几乎都是 185 采用图4所述策略的第②阶段采用的策略。当然,基于规则的机器翻译在言的层面和在语的 层面的做法是有所不同的,如果能遵循图4所述第①和第②两个阶段分工协作的策略,那么, 它将会与基于统计的机器翻译之间形成很好的有机组合关系,从而,可显著提升机译质量。 为表述清晰,在图4中两红色数字序号①分别说明英汉双语各自的对象语言,即:词(a1) 与字(b1),而两黄色数字序号②则分别说明英汉双语各自的解释语言,即:词组(a2)与字 190 组1(b2)、句(a3)与字组2(b3)。旨在双方各自先完成从①到②即从对象语言到解释语 言的转换。之后,再进行从②到②即从一类解释语言到另一类解释语言的转换。其中,绿色 Start 标识说明双方各自语汇一级的两类解释语言之间的相互转换只是开始或起步,而绿色 方框打钩的标识说明双方各自语句一级的两类解释语言之间的相互转换才是完成或结局。 例如:汉语的“做人”和“做事”这两个说法,前者是很难直译成为英语的,即使后者 195 也要插入某种成分才能顺利翻译成相应的英文。采用与图3和图4所示的旧和新两种策略在 取值和置信两方面的考虑,是明显地存在区别的。采用新策略,既可得到较为满意的译文, 又可让整个翻译过程变得相对简单。这与采用旧策略是不同的。其具体做法和结果如下: 第一步,解释:“做人”≈像某人那样存在;第二步,翻译:像某人那样存在≈being like somebody ≈do sth. as sb.。第一步,解释:“做事”≈做某事;第二步,翻译:做某事≈doing 200 something。由此可见,做人与做事这两个语辞或语句中的两个做字,不仅在义项的取值上 明显不同,而且,在不同文化背景的置信上也存在突出的差异,因而,两者并不是一个意思。 如果用旧策略,不经本族语自身的解释就直接在双语之间对译,如:“做人”与“do sb.” 或“do human”、“做事”与“do thing”,那么就无法翻译正确,因为,在英语中根本就 没有在汉语中那样的对应词语,所以,依据旧策略翻译是行不通的,只能得到错误的结果。 205 3 语言学研究对象由语言与言语进一步发展到的言和语 以汉语为例的普通语言学基础研究,尤其是基于双语信息处理的汉语字与字组的计算机 辅助分析,在字与词的关系问题研究上的重点突破,即笔者对语言学研究对象的言与语及其 相互关系这一普通语言学的根本问题研究的新进展。以下简单描述这一进展的实质性要点。 如果学界也能跟笔者一样确信:言和语,是比语言和言语更为基本而有效的研究对象, 210 那么,再继续沿着间接形式化途径往前走,一方面就可在纯形式研究对象的技术处理方法的 学术论文网Tag:代写代发论文 论文发表 职称论文发表 教育论文代写 |