多人谈 | 完权：辛顿没能跳出“中文屋”_学界-中国社会科学院语言研究所

多人谈 | 完权：辛顿没能跳出“中文屋”

作者：完权来源：《语言战略研究》2024年第6期时间： 2024-11-22

字号：小中大

“辛顿·乔姆斯基·语言学发展”多人谈

　　［编者按］2024年4月8日，有“人工智能教父”之称的杰弗里·辛顿（Geoffrey E. Hinton）在都柏林大学接受尤利西斯奖章的获奖感言里，对乔姆斯基提出了毫不客气的批评：“语言学家被一个名叫乔姆斯基的人误导了好几代……他有一个偏执古怪的理论，即语言不是学会的。他成功地说服很多人相信这一点。但这一看就知道纯粹是胡言乱语。语言显然是学会的。大型神经网络学习语言，不需要任何先天结构，只是从随机权重和大量数据开始。乔姆斯基却仍然在说，但这并非真正的语言，这不算数，这是不对的。许多统计学家和认知科学家也说，永远不可能在这样一个大网络里学习语言。乔姆斯基从来没有提出任何一种有关语义的理论。他的理论全是关于句法的。”这篇发言引起了中国语言学界的关注，陈国华教授把它译为中文，以《杰弗里·辛顿接受尤利西斯奖章时发表的获奖感言》为题，发表在《当代语言学》2024年第4期上。10月8日，霍普菲尔德（John J. Hopfield）和辛顿以“通过人工神经网络实现机器学习的基础性发现和发明”获得诺贝尔物理学奖后，关于大语言模型和语言学发展、辛顿和乔姆斯基的话题再度爆火。

　　一位人工智能大家，获得了诺贝尔物理学奖；他批评了一位美国的著名语言学家，却引发了中国语言学者的热烈讨论，反思中国语言学的问题。这形成了一个奇妙的蝴蝶效应。我刊随即与《当代语言学》编辑部筹划，联合举办“大语言模型与语言学发展座谈会”。10月17日，座谈会在商务印书馆召开，线上线下学者各陈己见。我刊特就此设多人谈栏目与学界共享。

　　本期嘉宾

完　权中国社会科学院语言研究所

　　辛顿没能跳出“中文屋”

　　虽然辛顿丝毫不留情面地批判了乔姆斯基，但是我们不必妄自菲薄，以为语言学就要被人工智能（AI）取代了。实际上，我觉得我们依然有价值，甚至可以反过来给辛顿一些建议。

　　辛顿在演讲中说：“大语言模型的工作方式，以及我们人类的工作方式就是，我们看到很多文本，或听到很多词串，进而获知词的特征，以及这些特征之间的交互作用。所谓理解，就是这么回事。神经网络模型正在以与人类完全相同的方式做理解。”但是，我们真的就是这么理解的吗？我觉得还不够。

　　确实，这种方式，非常接近我们认知功能学派推崇的usage-based linguistics，基于使用的方式，简而言之，用多了，就会了。基于使用的研究法的基本假设就是，语言知识是在联想网络中组织起来的，关联网络对使用频率敏感，在语言使用中高频的语例引起说话人心智中的固化，形成独立表征。所以，认知语言学家对辛顿的说法，必然是举双手欢迎。但是，辛顿对意义的理解，还是缺了那么一些。

　　这就来到了我的主要观点——辛顿没能跳出“中文屋”。

　　塞尔（John Searle）1980年提出一个“中文屋”问题。他的目的是要反对图灵测试，他认为一个计算机程序通过图灵测试并不意味着它具有智能，至多只能是对智能的模拟。为了论证自己的观点，塞尔提出了这样一个思想实验。

　　想象一个从小说英语、完全不会中文的人，被锁在一个房间里。房间里有一盒汉字卡片和一本规则手册。这本手册用英文写成，告诉人操作汉字卡片的规则，但并没有说明任何一个汉字的含义。它不是汉英字典！只是一个操作特定汉字卡片的规程，本质其实是一个程序。现在，房间外面有人向房间内递送纸条，纸条上用中文写了一些问题，房间里的人只要严格按照规则操作，就可以用房间内的汉字卡片组合出一些词句，完美地回答输入的问题。于是，这个人提供的输出，就通过了关于“理解中文”这个心智状态的图灵测试。

　　然而，塞尔指出，这个人其实仍然一点儿也不会中文。更进一步，无论是在这个房间中，还是这个房间整体，都找不到任何理解中文的心智存在。因此，通过图灵测试并不意味着拥有智能或者心智。不是拥有，只是功能上的模拟。就好像，假肢不是真胳膊。

　　塞尔真是了不起！现在看来，大语言模型展现出的强大功能，本质上依旧是高仿的假肢。大模型依旧是“中文屋”。有人对目前前沿的所有GPT系统模型做了综合性测试，发现没有哪个模型不是仍旧处于“中文屋”的阶段。判断的标准有这样几个。（1）复杂的语义解析，如理解情绪、视觉体验、隐喻、故事背景等。（2）情境推理，比如完成这样的情景推理任务：“遮阳伞是否适用于下雨天？”这需要世界知识。（3）创造性生成，也就是看它是否真正拥有与人类相似的想象力和认知创造性。我常常想，我给大模型输入我正在写的论文的前半段，它能不能给我生成后半段？答案不言自明。（4）自我意识与反思，这就是很多科幻小说里的机器人觉醒，比如电影《终结者》里的天网SKYNET觉醒后开始毁灭人类。

　　现在看来，目前的大模型远远没有达到能够觉醒的水平。所以我们不必担心，SKYNET永远不会派出T800。辛顿对AI的担心，目前看来，是多余的。因为被困在“中文屋”里，是永远造不出T800的，除非他愿意听一听我们认知语言学者的建议。

　　大家知道，认知语言学的背后，是体验哲学，是肉身哲学，是心寓于身的哲学。我们能够理解语言的意义，是因为我们从诞生起就在语言中感知。

　　我们要怎样来帮辛顿跳出“中文屋”？答案其实萨丕尔100年前就在《语言论》里说过了，就是意义要从语言以外去理解，依靠经验。AI需要有人的人生经验，才能真的有理解。现在图像识别还不能叫作图像感知，比方说，它识别出来这是猫了，就真的懂得这是猫吗？其实还是不懂的。我们是怎么认识猫的？依靠经验！我们不只是看了很多猫，而且还摸过、抱过、听过，讨厌过或喜欢过，跟猫在一起有故事。这才是意义。在我看来，现在的AI离理解意义还差十万八千里。要先有感知，才有认知，再有经验，再形成概念，才到语言，这就是意义的整体论。辛顿需要语用整体论帮助他，帮助AI理解意义。

　　我希望辛顿们最终能跳出“中文屋”，带给我们更好的AI。到那个时候，再像现在这样做语言学，恐怕真的要下岗了。我希望这事儿发生在我退休之后！

该文发表于《语言战略研究》2024年第6期，引用请以期刊版为准，转发自“语言战略研究”公众号。

搜索

多人谈 | 完权：辛顿没能跳出“中文屋”