基于大语言模型的中英文整合复杂性建模研究

Integrative Complexity Modeling in English and Chinese Texts based on large language model

作者： 李东启 ^1,2 朱廷劭 ^1,2
作者单位：

1. 中国科学院心理研究所, 北京 100101

2. 中国科学院大学心理系北京
提交时间：2024-04-10 17:09:58

摘要: 整合复杂性是心理学中用来测量个体思维结构的一个概念，主要涉及两个方面：区分性和整合性。区分性是指个体能够识别和理解信息中存在的不同观点或元素的能力；整合性是指个体能够将这些不同的观点或元素合并成一个有逻辑性和连贯性的整体的能力。整合复杂性的测量主要依靠人工对于文本内容进行分析，这些文本可以是书面材料、演讲稿、面试记录或任何其他形式的口头或书面表达。针对当前整合复杂性人工测评方法成本高、自动化评估方法精度低以及缺乏中文文本评估方案等问题，本研究基于大语言模型文本数据增强技术和模型迁移技术为整合复杂性的评估设计了对于中英文文本的自动化评估方案，并探索了整合复杂性两种子结构：精细整合复杂性和辩证整合复杂性的自动化评估方法。本文设计并实施了两个研究，首先基于大语言模型文本数据增强技术实现了对于英文文本整合复杂性的预测模型，其次基于模型迁移技术实现了对于中文文本整合复杂性的预测模型。研究结果显示：1）使用GPT-3.5-Tubo对于英文文本数据进行增强，使用预训练多语言Roberta模型进行词向量提取，使用文本卷积神经网络模型作为下游模型。与人工标注相比，整合复杂性Spearman相关系数为0.62，辩证整合复杂性相关系数为0.51，精细整合复杂性Spearman相关系数为0.60。优于机器学习方法以及未经过数据增强的神经网络模型。2）本文在研究二中建立了与研究一中的神经网络结构一致的模型，并将研究一中最终的模型参数迁移至本研究的模型中，对于中文文本整合复杂性进行训练。在零样本的情况下，迁移学习模型整合复杂性Spearman相关系数为0.31，辩证整合复杂性Spearman相关系数为0.31，精细整合复杂性相关系数为0.33，均优于随机参数情况下的模型表现（整合复杂性：0.17，辩证整合复杂性：0.10，精细整合复杂性：0.10）。在小样本情况下迁移学习模型整合复杂性Spearman相关系数为0.73，辩证整合复杂性Spearman相关系数为0.51，精细整合复杂性相关系数为0.73。

整合复杂性神经网络大语言模型迁移学习

来自： 朱廷劭
分类： 心理学 >> 应用心理学计算机科学 >> 计算机应用技术
投稿状态： 未投稿
引用： ChinaXiv:202404.00195 (或此版本 ChinaXiv:202404.00195V1)
DOI:10.12074/202404.00195V1
CSTR:32003.36.ChinaXiv.202404.00195.V1
推荐引用方式： 李东启,朱廷劭.(2024).基于大语言模型的中英文整合复杂性建模研究.中国科学院科技论文预发布平台.doi:10.12074/202404.00195V1 (点此复制)

版本历史

[V1]

2024-04-10 17:09:58

ChinaXiv:202404.00195V1

下载全文

1. 恶意代码SCMP分类方法框架与风险行为多标签机制	2024-05-09
2. 引导大语言模型生成计算机可解析内容	2024-04-21
3. 大模型与标准文献知识库的融合应用探索	2024-04-10
4. 简体中文LIWC2024(SCLIWC2024)词典的修订与验证	2024-04-09
5. 引导大语言模型生成计算机可解析内容	2024-04-07
6. 基于 Python 中 MeCab 库对日语文章进行文本分析处理实现	2024-04-04
7. 一种基于能量-信息转换的智能测度	2024-03-30
8. 基于大语言模型的中庸思维对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
9. 收入分配不平等对心理健康的影响机制研究——道德中心性的中介作用	2024-03-23
10. 基于文本数据增强的生活满意度预测模型优化	2024-02-29


公开评论匿名评论仅发给作者

基于大语言模型的中英文整合复杂性建模研究

版本历史

相关论文推荐