论人类下一代语言的可能—2.4领域语言与自然语言的比较

时间:2022-10-10 12:06:17

领域认知带来领域语言,这种实质性的语言观念是否适用于自然语言?

首先,自然语言并不是专门在认知方向使用,人类精神生活的各个侧面都在自然语言里有所反映,且相互混合,它的面貌不是单一的。其次,一个领域在没有出现优势的思想来统一认知前,并不能建立领域语言。这时可能已有一些认知,形成一些术语与表达,同时存在很多争论,符号使用上不会出现收敛的趋向。以此观点考察自然语言,它实际是多种多样认知的混杂。比如人类早期的各种神话、宗教,它们都提供了各自理解世界的图式,它们的理解形成了各自的话语,因为符号方式上的一致,各个部分都混杂在自然语言里。重要的还有,我们不会讨论自然语言所面向的领域,自然语言的使用是开放,面向全域的。形成整体上统一的认知总是困难的,甚至是不可能的。这对每种认知方式都一样。

虽然如此,本书认为自然语言仍是可与领域语言相比较的。从最简单的方面考察,新的认知会带来新的符号或术语,反映新认知所形成的概念。这适用于最初的自然语言吗?自然语言的早期词汇只是模拟声音,或者描绘形象就创造出来。其他的词汇,如“鸭”“羊”“房子”“树”“吃饭”“喝水”等等,看上去也与直观感知对应,无须多少思考。然而沟通能有效地进行,需要对日常事物进行分门别类,系统性地进行命名,得到尽可能完整的名称清单。这背后也需要有组织地去认知,只是这种组织是由时间来塑造的。

自然语言体现认知的一个特征是:自然语言里很多语言单位,其构成就反映出人们对其所指称事物的认识。比如汉字里,能飞的动物,都会带一个“鸟”偏旁,四足的动物带“犭”偏旁,水里的动物带一个“鱼”偏旁,同样原理也适用其他自然语言里词根、词缀的组合。这种方式中就包含着系统性分析的努力,只是这些规则不会贯彻一致地应用,这源于命名工作非自觉组织的性质。总有例外的情况也说明了能指与所指间关系的无理据。通过这种组合所反映的认知也不一定正确。比如一开始我们认为鲸鱼是一种鱼类,因为它生活在海洋里,相应的汉字也带有“鱼”偏旁。后来发现鲸鱼是用肺呼吸,而不用鳃呼吸,鲸鱼的呼吸过程就是其壮观的换气喷水的过程。从生物学意义上,鲸鱼是哺乳动物。认知总会改变,自然语言的变化则是有惰性的。那么这种方式会产生一个问题,它标识对象的归类或特征的方法耦合性太强。

领域语言背后是专业性的认知,对应地,自然语言背后的认知是常识。常识最初是对事物直观的理解与总结,这种理解与总结是随时发生的,发生可以是无意识的。常识累积的开始可以追溯到动物时代,不可能以今天的标准来衡量。从历史的角度来看,基于经验的常识是早期客观性的认知。常识是无数经验与观念的汇集,这种汇集更像是无规则的堆积。常识经常被认为肤浅、不可靠,甚至是混乱,但它仍构成人类整体及每一个体认知的地基,学者们经常追溯至常识中的符号使用,来分析我们后来观念的前身。一个有价值的设想是:对自然语言进行清洗,排除那些不被认为是以客观方式来认知世界所带来的语言成分,如与神话、宗教等所对应的语言内容,剥离出一个相对纯粹的经验认知对应的自然语言部分。这个缩小版的自然语言可以称为经验原语,它可以作为认知中的一个层次,用于建立认知符号的连续统。这不会是个容易的实践,需要很多努力才能知道可以做到什么程度。

从认知符号化角度来看。领域语言是领域认知的符号化,今天这个过程的结果可形成一个公理演绎的符号系统。自然语言谈不上符号的系统,最多只是形成了一个词汇表,记载于字典或词典。以今天的标准来说,认知中关键的内容——那些判断与结论,并没有由符号正式揭示出来,它们作为常识潜在于人的大脑里,所以常识经常是用时即来,不用时意识不到其存在。我们称自然语言的这类情况为认知未充分符号化。常识未充分符号化,与认知本身相关,也与所使用的媒介系统相关。最初的常识形成于口语时代,语言所有的内容分散于各个个体的头脑,通过口耳相传沿袭下来。能够流传的除了经常使用的词汇,也就只有少量刻意形成朗朗上口的习语与谚语。这些内容的大致面貌,也是到了自然语言的书面应用相对普及时,通过专人的收集整理才能呈现出来。常识未充分符号化,自然谈不上收敛。常识也没有清晰的边界来谈收敛。自然语言使用时,只要需要就可以去增加新的词汇与语句。自然语言里相对稳定的存在还是其使用的规则,语法被认为是这些规则的一个主要部分。

到了纸笔的媒介系统时代,二维的纸面可以让我们构造更复杂的符号,任意数量的书写符号可以按需要的方式排列在纸面上,我们也不用担心记忆的问题。这在基础的意义上支持了对一定范围内系统化认知的反映。实际的因果是反过来的,正是因为纸笔媒介系统具备这样的特性可利用,更加系统化的思考与体系化的知识才会出现。对于近现代的认知,静态地看,符号系统仍体现为一种符号单位的静态排列,实质上则是由逻辑、数学的应用动态建立起来的,这后面会有更多的论述。相比较,口语的时代,只凭借人的记忆,最终能够形成的只是经验性片断化的认知,它们只在我们的大脑中形成一些不稳定的联想的聚合。

从后人学习的过程来看,实质性的语言观意味着对语言的学习也是在建立语言背后的认知。各领域语言的学习过程显然是这样的性质。自然语言的学习也显示出同样的性质。随着对母语的学习,一个人初步的世界观也在形成。再去学习第二语言时,年龄大的人明显比年龄较小的要困难,通常这归结为生理上的因素。有可能这种困难也来源于在已形成习惯性认知方式的基础上,再加进有所不同的认知方式的难度。现在世界上主要的自然语言,它们的日常词汇并不对等。如表示同样谱系的颜色,一些语言区别出的词汇比另一些语言要多,使用不同语言的人在识别颜色时,能区分出的粒度也不一样。不仅是程度上,形成的概念与意义都会有很多的区别。这也是很多情况下,翻译时各自然语言间不能直译的原因。

我们看待领域语言与自然语言时,很容易发生一个错位:对于领域语言,我们容易想到的是其构建过程;对于自然语言,我们通常想到的是言语过程。即使成年,现代人也可能需要经历对各种学科知识的学习,这一方面是掌握其符号体系,一方面是建立相应认识,这个过程对应的是个体的领域语言建构的过程。我们对自然语言的学习,即常识的建立过程在儿童时期就基本完成,之后生活工作中,随时随地我们都在进行言语的活动,即语言的应用。婴幼儿时期对自然语言的学习也是对其他人言语活动的观察、模仿、领悟。只在语言学家的工作中,通过对言语活动的观察描写才形成对语言的总结。对我们而言,自然语言(母语)的应用熟悉、简单、自然。领域语言的应用则复杂得多,它不只是说话、书写,还得加上测量、建模、计算等方式,实质上是基于理论对于领域具体问题的常规研究。

自然语言,从其对常识的承载上,勉强可以从实质性语言观来理解。自然语言与领域语言比较所显示的明显差异,很难同样地看待二者。领域语言与自然语言的不同首先应从历史的角度来分析。作为最早出现的语言形式,早期的自然语言,其用途只可能是服务于种群的生存,为组织成员间的合作提供交流的工具。服务于早期生活、生产中的交流,常识性的认知与传统的自然语言方式足以。只有物种在生存没有较大压力,好奇心得以膨胀的后世,人类才可能去追求更精确的认知。目标的变化,认知方式会改变,符号使用也会产生分化,出现专门服务于这一目标的部分,且新的部分超出了自然语言的范畴。

领域语言并不会替代原有自然语言的相应部分,相反,围绕已建立领域语言的领域交流往往还得借助自然语言。前面讲到领域语言形成后,领域内的符号使用能够趋向于收敛,这只是指从理论发出的演绎过程来说的,需要交流的不只是涉及此类过程。比如,在明确问题的性质前,需要对问题进行原始描述;在对问题的讨论中,需要交流的对象不只是概念、原理、逻辑过程,而是交流各方围绕这些概念、原理、逻辑过程所表现出的思想行为;再比如想评价一个领域的符号体系,这不可能从内部进行,更好的做法是从更一般的背景,把当前的理论放在可比较的序列里来进行,总有一个更大的背景是没有形成统一认知的。等等。

交流可以用书面符号进行,但口语形式的现场交流总是不可回避,而口语源自自然语言,这是我们始终需要以自然语言交流的一个原因。不仅如此,自然语言与常识关联,常识是我们心智上先入为主的认知。当我们再建立不同以往的新认知,近乎本能地,我们都会期望能够从常识开始来理解。这产生了对新认知的解说。解说是以那些数学化或其他非自然语言方式构建的理论为对象,用自然语言来进行说明。解说常以对比、类比的方式,把那些新的概念、原理与熟悉的经验关联起来。解说也包括对创建者思路的说明,相关历史的说明,相关观点的比较等。科普的工作就是一种解说。解说经常是不准确,片面,甚至是曲解的,新的认知可以超出常识。自然语言的方式也与其他符号方式的效果不等价。尽管如此,解说工作看似难以避免。从社会的角度,任何领域内容的交流不应限于专业人员,面向对象也要考虑到初学者,或者是普通大众。

自然语言对各种非自然语言方式的领域语言的解说,使得以非自然语言方式所建立的领域语言,在自然语言也构造出对应的内容。如抽象符号表示的概念对应有自然语言的词汇术语,公式也有语句的陈述。领域语言的抽象符号、表达式也可能直接渗入自然语言。这些都改变着自然语言的面貌。同时也调整着我们的常识。这不一定是产生新旧交替,更像是在旧的常识上再铺上新的认知。新与旧的共存状况看似混乱,也许这样的状况正是所需要的。口语作为第一语言形式,以及常识的基础性,用法上的灵活性,再加上内容上的无限制,使自然语言最终成为一个通用表达交流平台的角色。在任何情况我们都能回到这一平台进行交流。这样,单独的自然语言研究仍具有独立的价值,且会侧重于其方法的研究。另一关键的影响是:这里会产生一个始终存在的牵引。后续的符号方式与结果需要以某种方式能回到自然语言。