文章主题:关键词:乔姆斯基,ChatGPT,语言知识

666AI工具大全,助力做AI时代先行者!

感谢您关注“永大英语”!

为何乔姆斯基对ChatGPT持否定态度?

冯志伟 张灯柯

在2023年的3月8日,知名语言学家乔姆斯基,配合罗伯茨(Ian Roberts)和瓦图穆尔(Jeffrey Watmull),在《纽约时报》上发布了一篇题为“ChatGPT的虚假承诺”的文章。该文强调了人工智能与人类在思维方式、语言学习及解释能力,以及伦理思考等方面存在的巨大差异。作者们警示读者,如果ChatGPT式的机器学习程序继续掌控人工智能的发展,那么人类的科学成就和伦理准则可能会受到影响。此外,乔姆斯基还指出,ChatGPT所采用的大规模语言模型,其实质上是剽窃。

值得注意的是,乔姆斯基对GPT持有批判性意见,这在很大程度上反映了他在生成语法领域的发展过程中,对语言哲学理论的重视。尤其是对人类知识本质、产生来源以及应用问题的探讨,乔姆斯基认为这些问题在生成语法中扮演着至关重要的角色。他将其中的语言知识问题称为“洪堡特问题”(Humboldt’s problem)。

德国著名学者洪堡特(W. Humboldt)曾提出一个观点,那就是语言并非简单的产物,而是一种富有创造性的活动(Energeria)。他认为,语言实际上是人类心智不断重复的过程,通过这种方式,音节逐渐演变成了思想的表达形式。那么,人类语言知识的本质究竟是什么呢?洪堡特所指的“有限手段的无限使用”正是关键所在。换言之,语言知识的本质问题,简而言之,就在于人类心智或大脑(mind/brain)中的语言认知系统。这个认知系统受制于一定的数量有限原则和规则体系。在这个系统中,高度抽象的语法规则构成了语言应用所需的语言知识。然而,人们往往无法自觉地意识到这些抽象的语法规则,正如乔姆斯基所说,这些语言知识属于无意识的或不言而喻的知识。因此,要理解语言知识的本质,我们必须深入研究人类心智中的语言认知系统,揭示其内在的规律和机制。

乔姆斯基提出,语言知识和语言运用能力是两个应被明确区分的概念。尽管两个人具有相同的语言知识,如发音、词汇和句子结构等方面的掌握程度一致,但他们的语言运用能力却可能存在显著差异。因此,语言知识和语言运用能力是两个不可混淆的概念。 language能力可以通过学习和实践得到提升和改善,而语言知识则保持着相对稳定性。尽管语言运用可能会受到损害或丧失,但人们的语言知识并不会完全消失。由此,我们可以看出,语言知识是内在的、与心智相关的特征,而语言运用能力则是外在的行为表现。在语言学研究中,我们关注的是语言的内在认知知识,而非语言运用的行为能力。语言知识主要体现在心智/大脑所拥有的认知系统中,而语言运用能力则主要通过实际的语言行为表现出来。

GPT所应用的端到端嵌入技术在处理非人类自然语言行为方面具有显著的效果。然而,该技术并不针对人类心智,因此不存在“有限手段的无限使用”的问题。这与乔姆斯基对语言知识本质的理解存在明显的差异。

原内容探讨了语言知识的来源问题,这个问题在西方哲学中被称为“柏拉图问题”。该问题主要针对人类如何获取丰富、具体且明确的知識、复杂的信仰和理智系统,以及人与世界接触短暂、狭隘、有限的条件下,为何我们能了解诸多事物。此外,刺激的贫乏与所获得的知识之间存在的巨大差异也是一个值得关注的问题。对此,杨小璐(2004)提出了一个关于语言知识来源的问题。她指出,尽管人类儿童在直接语言经验较少的情况下,却能迅速且一致地掌握语言,这成为一个令人好奇的现象。乔姆斯基则从生物学角度解释了这一现象,他认为人类心智/大脑中存在一种由生物遗传所决定的认知机制系统,称为“心智器官”。在适宜的经验触发或特定的经验环境下,这些认知系统可以正常生长发育并达到成熟。其中,决定人类语言知识的关键因素是心智器官中的一个子系统,即“语言机能”。语言机能通过经验环境的触发下得以生长和成熟,从而影响人类语言知识的获取过程。

研究发现,FOXP2是人类的独特基因。这一基因与其他哺乳动物的类似基因同属于一个家族,然而,这基因的排序却是人类特有的。因此,FOXP2也许就是乔姆斯基所假设的“语言机能”的生物学基础。由于存在FOXP2,所以,语言是天赋的,FOXP2给语言天赋论和刺激贫乏论提供了生物学上的支持(俞建梁,2011)

语言机能有初始状态(initial state)和获得状态(attained state)。初始状态是人类共同的、普遍一致的;获得状态是具体的、个别的。语言机能的初始状态叫做“普遍语法”(Universal Grammar,UG),语言机能的获得状态叫做“具体语法”(Particular Grammar,PG)。对普遍语法的本质特征及其与具体语法的关系的研究和确定,是解决关于语言知识的“柏拉图问题”的关键。

乔姆斯基的语言观:知识与能力的区分

GPT采用的数据驱动的“端到端嵌入”技术对于非人类的自然语言机器学习是行之有效的,但是,这种技术依靠大规模的语言数据,根本不存在“刺激贫乏”的问题,与乔姆斯基对于语言知识来源的认识是大相径庭的。

乔姆斯基把语言知识的使用问题叫做“笛卡儿问题”(Cartesian problem)。基于机械论哲学的物质概念,法国哲学家和数学家笛卡儿(Descartes)认为,所有非生命物质世界的现象、动物的生理与行为、大部分的人类器官活动,都能够纳入物质科学(science of body)的范畴。但是。笛卡儿又指出,某些现象不能处于物质科学的范畴之内,其中最为显著的就是人类语言,特别是“语言使用的创造性方面”,更是超出了机械论的物质概念所能够解释的范围。所以,对于语言的正常使用,是人类与其他动物或机器的真正区别。为了寻求对于语言这一类现象的解释,笛卡儿设定了一种“第二实体”的存在,这种第二实体就是“思维实体’(thinking substance)。“思维实体”明显不同于物质实体,它与物质实体相分离,并通过某种方式与物质实体相互作用。这一种“思维实体”就是心灵或者心智。语言知识的使用是内在于心智/大脑的。因此,对于这样的问题是很难解决和回答的。

GPT采用的数据驱动的“端到端嵌入”技术对于非人类自然语言的使用是行之有效的,但是,这种技术与“思维实体”没有关系,与乔姆斯基对于语言知识使用的认识是完全不同的。乔姆斯基主张,语言是语言机能或者语言器官所呈现的状态,说某个人具有语言L,就是说他的语言技能处于状态L。语言机能所获得的状态能够生成无限数目的语言表达式,每一个表达式都是语音、结构和语义特征的某种排列组合。这个语言机能所获得的状态是一个生成系统或者运算系统。

乔姆斯基的语言观:知识与能力的区分

为了与一般人理解的外在语言相区别。乔姆斯基把这样的运算系统,叫做“I语言”。字母I代表内在的(internal)、个体的(individual)、内涵的(intensional)等概念。这意味着,I语言是心智的组成部分,最终表现于大脑的神经机制之中,因此,I语言是“内在的”。I语言直接与个体有关,与语言社团存在间接的联系。语言社团的存在取决于该社团的成员具有相似的I语言,因此,I语言是“个体的”。I语言是一个函数或者生成程序,它生成一系列内在地表现与心智/大脑中的结构描写,因此I语言是“内涵的”。根据这种对于I语言的认识。乔姆斯基指出,基于社会政治和规范目的论因素之上的关于语言的通常概念,与科学的语言学研究没有任何关系,这些概念都不适合用来进行科学的语言研究。

生成语法对于语言的科学认识是内在主义(internalist)的,而GPT的大语言模型则是外在主义的(externalist)。GPT的方法是在广泛搜集语言材料的基础上,把离散的语言符号转化为词向量,通过机器学习来获取概率性的语言参数。这些参数存在于外部世界,处于人类的心智/大脑之外。GPT的方法是经验主义的方法,这种方法的基础是外在主义的语言观。乔姆斯基认为,根据外在主义的语言观,人们不能正确地认识和揭示人类语言的本质特征,不能解释人类语言知识获得的过程。只有内在主义的语言观才有可能正确地、全面地认识和解释人类语言知识的本质、来源和使用等问题。

乔姆斯基认为,生成语法的研究应当遵循自然科学研究中的“伽利略-牛顿风格”(Galilean-Newtonianstyle)。“伽利略风格”的核心内容是:人们正在构建的理论体系是确实的真理,由于存在过多的因素和各种各样的事物,现象序列往往是对于真理的某种歪曲。所以,在科学研究中,最有意义的不是考虑现象,而应寻求那些看起来确实能够给予人们深刻见解的原则。伽利略告诫人们,如果事实驳斥理论的话,那么事实可能是错误的。伽利略忽视或无视那些有悖于理论的事实。“牛顿风格”的核心内容是:在目前的科学水平下,世界本身还是不可解释的,科学研究所要做的最好的事情就是努力构建具有可解释性的理论,牛顿关注的是理论的可解释性,而不是世界本身的可解释性。科学理论不是为了满足常识理解而构建的,常识和直觉不足以理解科学的理论。牛顿摒弃那些无助于理论构建的常识和直觉。因此,“伽利略-牛顿风格”的核心内容是:人们应努力构建最好的理论,不要为干扰理论解释力的现象而分散精力,同时应认识到世界与常识直觉是不相一致的(吴刚,2006)。

生成语法的发展过程,处处体现着这种“伽利略-牛顿风格”。生成语法的目的是构建关于人类语言的理论,而不是描写语言的各种事实和现象(冯志伟,2009)。

语言学理论的构建需要语言事实作为其经验的明证。但是,采用经验明证的目的是为了更好地服务于理论的构建,生成语法所采用的经验明证一般是与理论的构建有关的那些经验明证。因此,生成语法研究的目的不是全面地、广泛地、客观地描写语言事实和现象,而是探索和发现那些在语言事实和现象后面掩藏着的本质和原则,从而构建具有可解释性的语言学理论。所以。在生成语法看来,收集和获得的语言客观事实材料越多,越不利于人们对于语言本质特征的抽象性的把握和洞察,而探索语言现象的可解释性,才是语言研究的目标之所在。GPT尽管功能强大,但是至今仍然是一个“黑箱”,不具有可解释性(Linzen,2019)。

乔姆斯基对于人类语言知识的本质、来源和使用问题的看法,与GPT对于非人类语言知识的本质、来源和使用问题的看法针锋相对,且GPT不具有可解释性,因此,乔姆斯基对于GPT持否定的态度,也就不足为奇了。

(参考文献 略)

(本文首次发表在《外语电化教学》2023年第2期)

乔姆斯基的语言观:知识与能力的区分

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!