一、研究背景
具身认知(Embodied Cognition)理论是认知科学领域的重要理论突破,它彻底打破了传统认知科学“身心二元论”的桎梏,确立了认知过程与身体体验、环境互动不可分割的核心范式。该理论的核心主张是人类的认知并非脱离身体的抽象符号运算,而是植根于身体的感官体验(触觉、味觉、视觉等)和与外界的互动过程中,大脑对世界的理解本质上是对身体体验的模拟与整合。
具身认知理论的跨学科影响力已延伸至语言学、计算机科学、神经科学等领域,正在重新定义人类认知的本质。然而,长期以来学界对具身认知理论的讨论多停留在思辨层面,缺乏可量化、可实证的研究工具。同时,学界普遍认为感官模态具身存在不对称性(如触觉比视觉更具身),但这一假设缺乏统一的实证支持,成为有关具身认知理论的核心争议议题。
面对这些挑战,赵青青副研究员及其团队融合语言认知实验与计算建模等前沿科学研究方法,对具身认知在语言学层面的表现进行探索,相关研究在理论创新和实践运用方面均取得重要突破,两篇研究论文发表于国际顶级期刊。
二、成果介绍
(一)成果一
通感与具身认知的理论突破——具身感知强度(Perceived Strength of Embodiment, PSE)实证模型
1.发表信息
Huang, Chu-Ren, Qingqing Zhao*(赵青青,共同一作、通讯作者), Kathleen Ahrens, Zhao Wang & Yunfei Long. 2025. Linguistic synesthesia and embodiment: A study based on Mandarin modality exclusivity norms. Language Sciences (109): 101715.(SSCI)
https://doi.org/10.1016/j.langsci.2025.101715

2.研究瓶颈
传统具身认知研究存在两大瓶颈:一是缺乏量化工具,对具身强度的判断依赖主观直觉;二是人类感官模态具身不对称性假设(即认为触觉最具身、视觉/听觉最不具身)长期主导学界,但未得到语言事实的实证检验。此外,某些语言通感的映射方向难以用传统假设解释,亟需新的理论框架。
3.研究方法
为了对具身认知进行科学量化,文章构建了具身感知强度(PSE)的实证模型,对词汇概念和感官模态的具身程度进行计算,并分别在不同的大规模数据库中进行验证。
(1)词汇概念x的具身感知强度(PSE) = 感官评分最大值(Mx) + 感官评分最大值(Mx)×(1 – 感官模态排他性(Ex))
(2)感官模态X的具身感知强度(PSE-S) = Σ[(优势词汇的具身感知强度(PSE))×(优势词汇的模态排他性(Ex))] ÷ 优势词汇数量(Num. of WD)
为了检验人类感官模态具身不对称性假设,文章还基于感觉体验性量表实验,收集了1046名普通话母语者(平均年龄22.97岁,SD = 4.63)对199个现代汉语通感形容词的五感评分数据,并参考Lynott & Connell(2009)计算感官模态排他性。
4.主要发现与学术价值
实验结果表明,通感形容词的PSE值显著高于非通感形容词(如“清”的PSE = 7.50,“响”的PSE = 5.37),而五大感官的PSE-S值排序为味觉(2.62) > 嗅觉(2.23) > 触觉(2.02) > 视觉(1.90) > 听觉(1.77),且味觉的PSE-S值显著高于触觉、视觉和听觉,其他感觉间未呈现显著差异。
这一结果不支持人类感觉的具身程度呈现等级序列的假设,也对触觉最具身的假设提出了挑战。此外,PSE模型可以预测以往研究无法解释的通感映射方向,如“酸痛”,“酸”的PSE值(7.53)高于“痛”的PSE值(5.86),因而符合从具身性较强的概念(而非感觉)映射到具身性较弱的概念。
简而言之,基于具身感知强度模型,文章首次实现了对具身认知过程的精密量化建模和科学计算,推动了具身认知理论研究从抽象思辨走向实证化、可计算化道路,为该领域的理论体系构建奠定了重要基石。
(二)成果二:
成果二:具身感官知识融入大语言模型的技术创新——SensoryT5的研发与应用
1.发表信息
Zhao, Qingqing(赵青青), Yuhan Xia, Yunfei Long, Ge Xu & Jia Wang. 2025. Leveraging sensory knowledge into Text-to-text transfer transformer for enhanced emotion analysis. Information Processing & Management, 62, 103876.(SCI、SSCI双检索,中科院分区TOP期刊)
https://doi.org/10.1016/j.ipm.2024.103876

2.研究瓶颈
传统模型(如T5、BERT)依赖文本语料学习,缺乏对“感官-情绪”关联的认知,导致在情感分析、讽刺识别等任务中难以捕捉隐性情绪,如“这杯咖啡太苦了”隐含的负面情绪。
3.研究方法
SensoryT5模型的核心方法与模型架构围绕具身感官知识的整合展开。
首先,文章以包含39,707个英语词汇六维感官评分(触觉、味觉、嗅觉、视觉、听觉、内在感受)的Lancaster感觉运动规范数据库为基础资源,通过GloVe嵌入回归处理未登录词,使感官词汇覆盖量扩展至2,088,280个。
接着,通过两层线性变换将六维感官向量映射至T5的1024维嵌入空间以确保模态一致性。在T5解码器后新增“感官注意力适配器”,用转化后的感官向量替换T5的查询向量。通过多头注意力机制融合语境信息与感官知识,同时采用交叉熵损失函数联合优化T5原有参数、感官注意力适配器参数和感官向量转化参数,从而实现语境与感官信息的协同学习。

实验设计覆盖了9个跨场景数据集(4个情感分类、3个讽刺识别、1个主观性分析、1个观点分类),样本总量超15万条,任务类型从二分类到32分类不等,以BERT、RoBERTa、XLNet、T5、LLaMA3等12个主流模型及LCL、HypEmo等情感分析专用SOTA模型为基线。
4.实验结果与研究价值
实验结果显示,SensoryT5在各类任务中均全面超越基线,达到最优效果。

因此,SensoryT5模型开创性地将语言中的具身感官体验知识深度融入大语言模型,首次实现了“感官-情绪”认知规律向AI可理解数据与算法的转化。本研究不仅为隐喻识别、情感分析、信息监测等自然语言处理关键任务提供了全新的研究范式,更为深入理解人类语言本质开辟了新的科学视角。也就是说,通过大语言模型效能提升策略的逆向分析,我们可以揭示人类学习和使用语言的大脑认知机制。
三、应用前景
基于上述有关具身认知的理论与技术成果,相关具身智能技术已展现出清晰的落地潜力。比如:
在数字医疗领域:借助SensoryT5模型,我们可对患者文本(如病历描述、在线咨询内容)的“感官-情绪”关联进行分析,“感受”患者未直接表达的心理状态(如通过“口感发苦”“浑身发冷”等感官描述,辅助判断抑郁或焦虑倾向),为心理疾病早期筛查提供支持。
在客服对话场景:通过模型可对用户对话中感官词汇(如“等待时间漫长”“操作繁琐”)的敏感捕捉,精准识别隐性不满情绪,帮助客服人员及时调整服务策略,提升用户满意度。
在教育辅导领域:针对学生反馈文本(如“这个知识点听起来很模糊”“公式推导让人头大”),模型可通过感官化表达感知学习难点,为教师提供个性化教学建议。
赵青青副研究员及其团队的研究为人工智能的“类人化”提供了核心思路,即让AI像人类一样通过“感官体验”理解世界。我们期待,未来的AI将不再是冰冷的算法,而是能与人类用“感知语言”共鸣的伙伴。这可能正是AI“感受世界”的终极意义,也是机器向理解人类迈出的关键一步。
作者介绍
赵青青,女,中国社会科学院(中国社会科学院大学)语言学重点实验室副研究员,硕士生导师。2018年毕业于香港理工大学,获哲学博士学位。研究领域为认知语言学、语料库语言学、计算语言学,目前主要关注语言中通感、隐喻以及情感等的认知特点与计算建模研究。
在中文CSSCI期刊《中国语文》《世界汉语教学》《语言教学与研究》,英文SCI/SSCI期刊Linguistics、Lingua、Cognitive Linguistics、Information Processing& Management、Language Sciences、Natural Language Processing等国内外刊物发表论文30多篇。自然语言处理论文被计算语言学顶级会议ACL、EMNLP等接收。出版英文专著一部(Embodied Conceptualization or Neural Realization: A Corpus-driven Study of Mandarin Synaesthetic Adjectives),获“语言学前沿丛书年度博士论文”最佳论文奖。完成国家社科基金青年项目一项(“基于实验范式的现代汉语通感现象研究”,19CYY006)。长期担任国际SCI/SSCI期刊Language、Linguistics、Lingua、Brain and Language、Natural Language Processing、Humanities and Social Sciences Communications、Nature Communications,中文权威/核心期刊《中国语文》《世界汉语教学》《当代语言学》《语言教学与研究》《汉语学报》等的匿名审稿专家。
相关链接: