five

Social IQa

收藏
github2025-03-14 更新2025-03-16 收录
下载链接:
https://github.com/DolbyUUU/DeepEnlighten
下载链接
链接失效反馈
官方服务:
资源简介:
设计用于探测日常场景中的情感和社交智能。

Designed to detect emotional and social intelligence in everyday scenarios.
创建时间:
2025-03-12
原始信息汇总

DeepEnlighten 数据集概述

数据集简介

  • 数据集名称:Social IQa
  • 数据集用途:用于探测模型在日常生活场景中的情感和社会智能
  • 数据集内容:包含问题及对应答案,例如:“为什么乔丹靠近特蕾西?”答案:“确保其他人听不到。”

数据集结构

  • 示例格式:问题 + 答案
  • 数据预处理:在 DeepEnlighten/verl/utils/reward_score/socialiqa.py 中实现

数据集特点

  • 奖励规则:在 DeepEnlighten/verl/utils/reward_score/socialiqa.py 中定义,包括格式奖励、答案奖励等

相关成果

  • 数学推理泛化能力:模型在社会推理任务上的表现可以泛化到数学推理任务
  • 长CoT现象:长Chain of Thought(CoT)并非在所有实验中都出现,仅在任务具有挑战性时出现
  • 长CoT与准确率关系:长CoT的出现并不总是与高准确率相关
  • 语言混合现象:模型存在语言混合现象,但并不普遍

数学推理任务准确率

任务类型 DeepEnglighten-3B Llama3.2-3B-Instruct
math-cot-test 0.4419 (3750) 0.2672 (3750)
cmath-cot-test 0.5995 (824) 0.5480 (823)
gsm8k-cot-test 0.7576 (330) 0.7660 (329)

语言分布

类别 数量 百分比
仅英文 96674 98.23%
仅中文 0 0.00%
混合(英文和中文) 1727 1.75%
搜集汇总
数据集介绍
main_image_url
构建方式
Social IQa数据集旨在探索情感与社会智能在日常情境中的应用,其构建基于精心设计的日常场景问题,通过问题与答案的配对形式,对模型在情感与社会推理方面的能力进行测试。该数据集的构建方式采用纯强化学习框架,无需监督微调,直接对基础模型进行后训练,以实现社会推理能力。
使用方法
使用Social IQa数据集进行训练时,用户需要配置相关的WandB、GPU等设置,并通过执行特定的训练脚本启动训练过程。训练过程中,模型将根据数据集中的问题和答案进行学习,通过强化学习机制不断优化其社会推理能力。
背景与挑战
背景概述
Social IQa数据集,旨在探索机器在情感和社会智能方面的理解能力,其设计背景是模拟日常场景中的情感和社会交往。该数据集的创建,源自对机器是否能够通过纯粹基于强化学习的方式,不依赖监督微调,实现对基础模型的社会推理能力后训练的研究。Social IQa数据集的构建,为相关领域提供了重要资源,对于理解机器在处理情感和社会问题时的能力具有重要价值。该项目由DeepEnlighten项目所采用,并进行了相关研究,其研究成果对于推动人工智能在社会推理领域的发展具有显著影响力。
当前挑战
Social IQa数据集面临的挑战主要包括:1)如何准确评估模型在社会推理任务上的表现,尤其是在处理超出分布的任务时;2)强化学习框架在处理社会推理任务时,如何避免对特定语言或情境的过度依赖;3)模型训练过程中,如何平衡长文本输入和输出之间的关系,以及如何正确理解长文本输出并不总是意味着更高的情感智能水平。此外,构建过程中,数据集的预处理和奖励模型的设定也是关键挑战,它们直接关系到模型训练的效率和最终性能。
常用场景
经典使用场景
Social IQa数据集旨在探索模型在处理日常情景中的情感和社会智能。其经典使用场景在于,通过设定日常生活中的问题,例如推断人物行为背后的动机,来训练模型的社会推理能力,从而提升模型在处理复杂人类交互情景时的表现。
解决学术问题
该数据集解决了在人工智能领域,特别是在自然语言处理中,模型缺乏对社会情感情境理解的问题。通过Social IQa,研究者能够评估和改进模型在处理需要情感和社交智能的任务时的性能,这对于发展更为智能和人性化的AI系统具有重要意义。
实际应用
在实际应用中,Social IQa数据集可以被用于开发能够更好地理解和响应人类情感和社会信号的AI系统,如智能助手、客户服务机器人等,以提升人机交互的自然性和有效性。
数据集最近研究
最新研究方向
Social IQa数据集近期研究方向聚焦于情感与社会智能在日常情境下的应用,通过纯强化学习(RL)技术对基础模型进行后训练,以提升其社会推理能力。研究结果表明,社会推理能力可以从情感智能(EQ)泛化至需要数学推理的智能任务(IQ)。此外,研究发现较长的思维链(CoT)并不总是出现,且其长度与情感智能水平并不直接相关。同时,研究中观察到语言混合现象,但并不普遍。这些发现对于理解模型在社会推理任务中的表现和优化策略具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作