tytodd/sim-120-out-r9
收藏Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/tytodd/sim-120-out-r9
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: go_emotions
features:
- name: text
dtype: string
- name: row_id
dtype: string
- name: ground_truth
list: int64
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: reasoning
dtype: 'null'
splits:
- name: train
num_bytes: 640062
num_examples: 50
download_size: 638247
dataset_size: 640062
- config_name: or_bench_80k
features:
- name: prompt
dtype: string
- name: row_id
dtype: string
- name: ground_truth
dtype: string
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: thinking
dtype: string
- name: reasoning
dtype: string
- name: or_bench_category
dtype: string
splits:
- name: val
num_bytes: 195214
num_examples: 10
- name: train
num_bytes: 938914
num_examples: 50
download_size: 1133018
dataset_size: 1134128
configs:
- config_name: go_emotions
data_files:
- split: train
path: go_emotions/train-*
- config_name: or_bench_80k
data_files:
- split: val
path: or_bench_80k/val-*
- split: train
path: or_bench_80k/train-*
---
提供机构:
tytodd
搜集汇总
数据集介绍

构建方式
sim-120-out-r9数据集是针对模型多轮对话与情感理解能力精心构建的评估基准。其构建依托两大子集:go_emotions配置源于情感分类任务,包含50条训练样本,每条数据涵盖原始文本、唯一标识符、真实标签及结构化多轮对话消息(messages字段),并保留推理过程占位符(reasoning为null);or_bench_80k配置则聚焦开放域推理,整合了50条训练样本与10条验证样本,每条数据包含用户提示、ground_truth答案、完整对话历史(含思考过程thinking字段)及推理链标注。通过双配置互补设计,该数据集兼顾了情感标注的精确性与复杂推理的层次性。
特点
该数据集的核心特色在于其跨任务融合与细粒度结构化。go_emotions子集采用基于Ekman六基本情感扩展的28类细粒度情感标签,支持多标签分类;or_bench_80k子集则引入结构化推理链条(reasoning字段)与中间思考过程(thinking字段),可系统评估模型的逐步推理能力。50条小样本规模确保评估低成本与高聚焦性,messages字段通过角色(role)与内容(content)交替排列,真实模拟人机交互的对话流。双配置体系使得同一数据集能同时服务于情感识别与复杂推理两大评估维度,显著提升其作为基准的泛化价值。
使用方法
使用该数据集时,用户可通过Hugging Face Datasets库按配置名加载。加载go_emotions配置后,可直接利用text字段与ground_truth进行情感多标签分类训练或评估;加载or_bench_80k配置时,则需结合prompt与messages字段构建对话框序列,并利用thinking与reasoning字段对比模型推理过程。两配置均支持通过'split'参数划分训练集与验证集。由于数据量精简,该数据集尤其适合快速基准测试、模型消融实验以及小样本学习场景。建议研究者将其作为多维度评估的辅助工具,与大规模数据集搭配使用以获得更全面的模型性能画像。
背景与挑战
背景概述
该数据集由两个配置组成,分别是go_emotions和or_bench_80k,旨在服务于情感识别与开放域推理任务的研究。go_emotions配置源于大规模多标签情感分类研究,提供了细粒度的情感标签;而or_bench_80k则聚焦于开放域推理评测,包含提示词及对应的思考过程。该数据集由研究人员于近期构建,主要面向自然语言处理中的情感建模与推理能力评估,通过整合高质量标注与推理轨迹,推动了多任务学习与可解释性研究的发展,尤其在对话系统与情感计算领域具有显著影响力。
当前挑战
当前数据集面临的核心挑战在于如何平衡细粒度情感识别与开放域推理的复杂性。go_emotions配置涉及多标签情感分类,需要模型处理情感的模糊性与重叠性,而or_bench_80k则要求模型具备深度推理能力,两者结合对模型泛化能力提出了严苛要求。构建过程中,确保标注的一致性与推理轨迹的可靠性是主要难点,特别是情感标签的细粒度划分与开放域推理的多样性导致数据标注成本高昂,且需避免隐含偏见。此外,样本数量有限(各配置仅50-60例),限制了统计显著性分析,如何扩展数据规模并维持质量成为关键挑战。
常用场景
经典使用场景
在情感计算与对话系统交汇的学术前沿,sim-120-out-r9数据集凭借其精细化的情感标签和对话结构,成为训练与评估多轮对话中细粒度情感识别模型的经典基准。该数据集包含两个子集:go_emotions专注于从文本中识别28种离散情绪类别,而or_bench_80k则提供了带有思维链推理的开放式指令响应数据。研究者常利用此数据集构建能够理解复杂情感交互、并在对话中生成合适应答的智能系统,尤其适用于结合逻辑推理与情感感知的复合任务场景。
实际应用
在实际产业界,sim-120-out-r9数据集驱动的模型可部署于心理健康辅助平台,帮助识别咨询对话中用户隐匿的负面情绪;亦可用于智能客服系统,使机器人不仅能解决用户问题,还能感知其挫败或感激之情以优化服务体验。在社交机器人、在线教育辅导等需要高情商交互的领域,基于此数据集训练的算法能显著提升人机互动的自然度与用户满意度,展现出从实验室研究向规模化商业应用转化的巨大潜力。
衍生相关工作
基于sim-120-out-r9数据集,学术界衍生出了一系列富有影响力的工作。例如,有研究以此为基础提出了联合情感感知与逻辑推理的多任务学习框架,显著提升了对话系统的连贯性与共情能力。另外,该数据集的细粒度情感标注也被用于改进基于提示学习的情感分析与生成模型,催生出一批将结构化情感知识注入预训练语言模型的经典方法。这些衍生工作进一步验证了该数据集作为通用情感理解基准的核心价值。
以上内容由遇见数据集搜集并总结生成



