REDDME

Hugging Face2025-08-26 更新2025-08-28 收录

下载链接：

https://huggingface.co/datasets/Shadowking912/REDDME

下载链接

链接失效反馈

官方服务：

资源简介：

REDDME是一个手动注释的数据集，它基于公开可用的心理健康子数据集BeCOPE扩展而成。BeCOPE将帖子分为三种类型：互动型（帖子作者和他人之间的往返对话）、非互动型（帖子吸引他人参与，但作者不回复）和孤立型（帖子没有收到评论）。REDDME从BeCOPE中选取了4760个帖子，并手动标注了支持属性，包括事件、效果和要求，每个属性都标注了跨度（rationales）和强度级别。

创建时间：

2025-08-23

原始信息汇总

REDDME 数据集概述

数据集基本信息

许可证：CC BY-NC-ND 4.0
来源论文：Assess and Prompt: A Generative RL Framework for Improving Engagement in Online Mental Health Communities
论文链接：https://arxiv.org/abs/2508.16788
会议发表：Findings of EMNLP 2025

数据集描述

REDDME 是一个基于 BeCOPE 心理健康子版块语料库扩展的手动标注数据集。

数据来源

源自 BeCOPE 公开心理健康子版块语料库
BeCOPE 原始分类：
- Interactive：原始发帖者与同伴之间的双向对话
- Non-interactive：发帖吸引同伴参与但原始发帖者未回复
- Isolated：发帖未收到任何评论

标注内容

数据规模：4,760 个帖子
标注方式：手动标注
支持属性：
- Event（事件）
- Effect（影响）
- Requirement（需求）
标注细节：
- 每个属性标注了 spans（ rationale）
- 每个属性标注了强度级别

引用信息

bibtex @misc{gaur2025assesspromptgenerativerl, title={Assess and Prompt: A Generative RL Framework for Improving Engagement in Online Mental Health Communities}, author={Bhagesh Gaur and Karan Gupta and Aseem Srivastava and Manish Gupta and Md Shad Akhtar}, year={2025}, eprint={2508.16788}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2508.16788}, }

搜集汇总

数据集介绍

构建方式

REDDME数据集基于公开心理健康论坛语料库BeCOPE构建，采用人工标注方式对4760篇帖子进行精细化扩展。标注过程聚焦于支持性属性分析，包括事件描述、影响程度及需求类型三个维度，每个属性均标注文本跨度及其强度等级，确保数据层次丰富且标注一致。

特点

该数据集突出表现为多维度标注体系，不仅涵盖交互类型分类，更深入标注事件-影响-需求的语义三元组，并辅以强度量化指标。其标注跨度提供可解释性依据，适用于细粒度情感支持分析任务，为心理健康对话研究提供结构化数据支撑。

使用方法

研究者可借助该数据集训练生成式对话模型，通过解析支持属性强度指标优化响应生成策略。具体应用时需注意遵循标注指南中的强度分级标准，结合事件-影响-需求的关联性设计条件生成任务，适用于心理健康社区的参与度提升研究场景。

背景与挑战

背景概述

随着在线心理健康社区的快速发展，如何提升用户参与度成为计算社会科学与自然语言处理交叉领域的重要课题。REDDME数据集由Bhagesh Gaur等学者于2025年构建，基于EMNLP会议发表的研究成果，旨在通过人工标注扩展BeCOPE语料库。该数据集聚焦于心理健康支持场景中的交互模式分析，通过标注事件、影响和需求三个维度的支持属性及其强度等级，为研究在线社区中的支持性对话机制提供了细粒度标注框架，对促进心理健康干预的智能化发展具有显著意义。

当前挑战

该数据集核心挑战在于解决在线心理健康社区中支持性对话的细粒度语义解析问题，需准确识别用户表达中的情感需求层次与支持诉求强度。构建过程中面临标注一致性的技术难点，由于心理健康文本具有高度敏感性和语义模糊性，需要专业背景的标注人员通过多轮校准确保事件、影响、需求三个维度的跨度标注与强度评级可靠性。此外，在保持原始对话隐私性的前提下进行有效信息抽取，也对数据脱敏与伦理合规提出了更高要求。

常用场景

经典使用场景

在心理健康计算语言学研究中，REDDME数据集被广泛用于训练和评估支持性对话生成模型。该数据集通过精细标注的事件、影响和需求属性，为研究者提供了分析在线社区中用户互动模式的宝贵资源。模型能够依据这些标注识别高危发言并生成恰当回应，显著提升了对话系统的情境感知能力与共情表达水平。

实际应用

在实际应用层面，REDDME支撑了智能心理援助平台的开发。基于该数据集训练的模型可实时分析社区论坛发言，自动识别需要紧急干预的高风险用户并提供初步情感支持。这类系统已应用于在线心理健康社区的内容管理，通过生成个性化回应显著提升用户参与度，为传统心理咨询体系提供了重要的数字化补充手段。

衍生相关工作

该数据集催生了多项创新性研究，包括基于强化学习的对话生成框架Assess-Prompt及其变体。这些工作通过结合REDDME的强度标注与生成模型，实现了对支持性回应的质量量化评估。后续研究进一步扩展了多模态心理健康分析框架，将文本特征与用户行为模式相结合，形成了更为全面的数字心理健康干预解决方案。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集