tytodd/sim-20-out-r11
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/tytodd/sim-20-out-r11
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: go_emotions
features:
- name: text
dtype: string
- name: row_id
dtype: string
- name: ground_truth
list: int64
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: thinking
dtype: string
- name: reasoning
dtype: string
splits:
- name: val
num_bytes: 101290
num_examples: 5
download_size: 109791
dataset_size: 101290
- config_name: or_bench_80k
features:
- name: prompt
dtype: string
- name: row_id
dtype: string
- name: ground_truth
dtype: string
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: thinking
dtype: string
- name: reasoning
dtype: string
- name: or_bench_category
dtype: string
splits:
- name: val
num_bytes: 120405
num_examples: 5
- name: train
num_bytes: 85010
num_examples: 5
download_size: 221680
dataset_size: 205415
configs:
- config_name: go_emotions
data_files:
- split: val
path: go_emotions/val-*
- config_name: or_bench_80k
data_files:
- split: val
path: or_bench_80k/val-*
- split: train
path: or_bench_80k/train-*
---
提供机构:
tytodd
搜集汇总
数据集介绍

构建方式
sim-20-out-r11数据集整合了go_emotions与or_bench_80k两个子集,旨在为情感分析及开放式推理任务提供结构化训练与评估数据。go_emotions子集包含文本、行号、真实标签及多轮消息对话记录,其中消息部分嵌入角色、内容及思考过程,并辅以推理字段,以标准化JSON格式存储,验证集包含5个样本。or_bench_80k子集则扩展了提示词、行号、真实标签、消息对话、推理字段及类别标签,涵盖训练与验证集,各含5个样本。数据通过HuggingFace Datasets库加载,采用统一字段设计,确保多任务场景下的兼容性与复用性。
特点
该数据集的核心特点在于其多模态融合与推理增强设计。go_emotions子集聚焦细粒度情感分类,通过消息中的思考字段捕捉模型生成过程中的内在逻辑。or_bench_80k子集则面向开放式基准评估,引入类别标签以支持多层次推理任务。数据量虽小但结构精炼,每个子集均保留完整对话序列与真实标签,便于进行少样本学习与模型行为分析。此外,思考与推理字段的并存,为探究模型决策路径提供了独特视角,适合用于可解释性研究。
使用方法
使用sim-20-out-r11数据集时,可通过HuggingFace的load_dataset函数加载指定子集,如load_dataset('sim-20-out-r11', 'go_emotions')。数据以字典形式返回,包含text、ground_truth等字段,其中messages列表适用于多轮对话模型微调。用户可基于ground_truth进行监督学习,或利用thinking与reasoning字段进行推理链分析。对于or_bench_80k子集,额外提供的or_bench_category字段可用于任务分类与条件生成。建议在加载后检查数据样本规模,并结合具体任务需求选择适合的配置与分割。
背景与挑战
背景概述
在自然语言处理与情感计算交叉领域,情感识别任务长期面临从单一标签分类向多标签、细粒度情感理解演进的挑战。sim-20-out-r11数据集由研究机构于近期构建,旨在通过整合GoEmotions与OrBench80k两大资源,推动大语言模型在情感推理与可解释性方面的发展。该数据集包含原始文本、多标签情感标注以及模型推理链(thinking与reasoning字段),为探索情感背后的认知逻辑提供了独特的微观数据支撑。其核心研究问题聚焦于如何利用思维链数据提升模型对复杂情感(如矛盾情绪、隐含情感)的辨识能力,对增强语言模型的情感智能与透明度具有重要启示意义。
当前挑战
该数据集面临的核心挑战包括:一是情感标注的歧义性与主观性导致构建可靠多标签真值成为难点,特别是在GoEmotions此类包含28类细粒度情感的数据中,需平衡标签稀疏性与分类粒度;二是推理链数据的获取与质量保障面临困难,模型生成的‘thinking’与‘reasoning’字段可能包含逻辑谬误或与真实认知过程偏差,需设计有效验证机制;三是跨数据集(go_emotions与or_bench_80k)的格式与情感体系对齐问题,不同来源数据在类别层级、语境依赖度上存在差异,需统一标准化处理以支持联合训练与评估。
常用场景
经典使用场景
在自然语言处理领域中,情感分析与推理能力评估一直是备受关注的核心议题。sim-20-out-r11数据集汇聚了来自GoEmotions与OrBench80K两个子集的精华,前者聚焦于细腻的情感分类任务,后者则致力于评测模型的开放域推理与指令遵循能力。该数据集最经典的使用场景在于对大型语言模型进行多维度能力检验,研究人员可以通过其精心设计的验证集与训练集,系统性地评估模型在情感理解、逻辑推理以及复杂指令执行等方面的表现,从而推动语言智能向更深层次的语义解析与认知模拟迈进。
实际应用
在产业实践中,sim-20-out-r11数据集展现出广泛的适用价值,尤其适用于智能客服系统、社交媒体内容审核以及教育辅助工具的开发与优化。基于其情感分析子集,开发者可以训练模型实现用户情绪的实时识别与差异化响应,从而提升人机交互的亲和力与效率。同时,借助推理能力子集,能够构建更具逻辑一致性的问答系统或决策支持工具,帮助企业在舆情监控、个性化推荐等领域做出更为精准的预判与应对。
衍生相关工作
围绕该数据集,一系列衍生工作如雨后春笋般涌现,其中最引人注目的是基于情感推理的模型微调技术与多任务学习框架的探索。研究者利用其多层级标注信息,创新性地提出了联合情感识别与逻辑验证的注意力机制网络,有效提升了模型在复杂语境下的泛化能力。此外,该数据集还催生了一批专注于模型推理鲁棒性评估的基准测试,促使学术界开发出更多面向真实场景的情感与推理协同优化算法,进一步拓展了语言模型在情感计算与认知科学中的研究边界。
以上内容由遇见数据集搜集并总结生成



