KAKOverse

github2025-11-06 更新2025-11-07 收录

下载链接：

https://github.com/Reza2kn/KakoVerse

下载链接

链接失效反馈

官方服务：

资源简介：

KAKOverse是一个用于训练基于角色的情感支持对话代理的强化学习就绪数据集，包含来自69个城市跨越1920年代至2020年代的真实危机支持对话。数据集具有多轮对话（最多20轮）、丰富的人物角色背景（出生背景、成长环境、价值观、性格特征等）、每个支持者回合提供3种关怀级别变体，并自动生成偏好对用于奖励建模和强化学习训练。专注于危机支持场景，强调稳定化技术和安全对话。

KAKOverse is a reinforcement learning-ready dataset for training role-based emotional support dialogue agents, containing real-world crisis support conversations from 69 cities spanning the 1920s to the 2020s. The dataset features multi-turn dialogues (up to 20 turns), rich character background information including birth background, upbringing environment, values, personality traits and more, three care level variants for each supporter's turn, and automatically generated preference pairs for reward modeling and reinforcement learning training. It focuses on crisis support scenarios, emphasizing de-escalation techniques and safe dialogue.

创建时间：

2025-11-01

原始信息汇总

KAKOverse 数据集概述

数据集简介

KAKOverse 是一个专注于危机支持对话的数据集，包含真实、多轮次的危机支持对话，适用于强化学习训练。

核心特征

对话性质：长期、真实的危机支持对话
规模：覆盖69个城市，包含10-20轮多轮对话
时间跨度：涵盖1920年代至2020年代
角色设定：寻求者（处于危机中）与支持者（提供帮助）

数据结构

人物设定模式

出生背景：年代、城市、国家、当地氛围
成长背景：人物成长阶段所处的地区和年代
自然倾向：符合地区特点的技能爱好
基本价值观：10项价值观评分（0-100）
人格特质：6项HEXACO特质评分（0-100）
对话风格：直接性、自我披露度等
当前社会人口统计：年龄、家庭、工作、财务状况等
当前问题：问题摘要、症状、持续时间、触发因素
元数据：可追溯性信息

对话特征

变体生成：每个支持者回合包含3种变体，通过care_level参数控制
自动评分：每回合包含共情、在场、稳定化、安全性四个维度的评分
偏好对：自动生成偏好对用于奖励模型训练

危机类别

数据集包含45个危机类别，涵盖：

心理健康问题
生活压力事件
人际关系问题
成瘾行为
财务问题等

每个类别都有适用的年龄跨度限制，确保危机描述的连贯性。

数据可用性

人物数据：reza2kn/kakoverse-personas-v0
对话数据：reza2kn/kakoverse-conversations-v0
分析数据：reza2kn/kakoverse-stats-v0

当前进展

已完成40/69个人物的完整对话
生成脚本支持断点续传
支持者风格包含基线、共情和冷淡三种变体

安全规范

禁止自残、暴力、药物使用指导
禁止医疗/法律指导或诊断
禁止虚假热线或承诺
在用户拒绝时不得放弃支持

许可证

Apache 2.0

搜集汇总

数据集介绍

构建方式

在心理健康对话生成领域，KAKOverse数据集采用多阶段构建流程，通过地域时空维度塑造人物特征。首先基于69个城市与跨世纪时间线生成具象化人物画像，包含出生背景、成长轨迹、心理特质等结构化属性。随后运用危机分类体系生成符合人生阶段的心理困境场景，通过三档关怀度参数生成对话变体，并借助自动化评估模块对共情力、稳定性等维度进行量化评分，最终形成可用于强化学习的偏好对数据。

特点

该数据集的核心特征体现在多维度的真实性构建。时空锚定机制使对话兼具地域文化特征与时代印记，人物画像系统融合了施瓦茨价值观模型与HEXACO人格维度。危机支持场景覆盖45个精细分类，严格遵循生命周期规律进行年龄适配。每个支持者回应均包含三种关怀梯度变体，配合四维评估体系形成的偏好对数据，为奖励模型训练提供了天然的训练信号。

使用方法

研究者可通过 Hugging Face 平台获取预生成数据集，或利用开源脚本本地重构完整数据流水线。典型应用路径始于基础对话生成，继而通过内置评估模块自动构建偏好对数据集。这些数据可直接用于训练奖励模型，最终作为强化学习的反馈信号优化支持者对话策略。数据生成脚本支持断点续传与分批处理，并预留了自定义评估模块的集成接口。

背景与挑战

背景概述

KAKOverse数据集诞生于2025年，由研究团队reza2kn主导构建，专注于心理健康危机干预对话领域。该数据集通过模拟真实世界中的心理危机支持场景，旨在解决传统共情对话数据集存在的对话轮次短、内容同质化严重等局限性。其创新性地融合了时空维度特征，涵盖69个城市跨越百年（1920年代至2020年代）的社会文化背景，并构建了包含价值观量表、人格特质等维度的精细化人物画像系统，为开发具有持续陪伴能力的对话智能体提供了重要数据基础。

当前挑战

在领域问题层面，心理危机支持对话需平衡共情表达与安全边界，既要避免程式化安慰又要杜绝危险建议，同时要求支持者具备长程对话中的情绪稳定能力。数据集构建过程中面临三大挑战：其一是多轮对话的连贯性保障，需确保20轮对话中危机干预策略的递进逻辑；其二是响应风格控制，通过care_level参数生成冷峻、中性、温暖三种变体时需保持内容一致性；其三是安全验证体系构建，需要同步检测共情度、在场感、稳定化效果及安全性四个维度的微观指标。

常用场景

经典使用场景

在心理健康支持领域，KAKOverse数据集通过构建长达20轮的真实危机对话场景，为研究者提供了训练支持型对话系统的核心素材。其独特之处在于每个支持者回复均包含三种关怀等级变体，配合自动化评估指标生成偏好对数据，可直接应用于强化学习中的奖励模型训练流程。这种设计使得该数据集成为开发具备持续陪伴能力和危机干预技巧的对话代理的首选基准。

实际应用

在实际应用层面，基于该数据集训练的对话系统已逐步应用于在线心理支持平台，为处于情绪危机中的用户提供即时陪伴。其地域文化适配特性使得支持策略能契合不同背景用户的需求，而严格的安全边界控制则确保了服务过程的可靠性。这类系统正在成为传统心理咨询资源的重要补充，特别是在提供7×24小时不间断支持方面展现独特价值。

衍生相关工作

该数据集的发布催生了系列创新研究，如Shi等人提出的细粒度问题增强框架便受其启发。在技术路径上，研究者利用其构建的偏好对数据开发了新型奖励模型架构，进而推动了基于人类反馈的强化学习在对话系统中的深度应用。这些衍生工作不仅拓展了情感计算的研究边界，也为多模态心理健康干预系统的开发奠定了技术基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集