Mental_Health_Knowledge_Dataset
收藏Hugging Face2025-11-20 更新2025-11-21 收录
下载链接:
https://huggingface.co/datasets/SIR-Lab/Mental_Health_Knowledge_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
本数据集是一个专门为心理健康支持设计的离线移动对话机器人所使用的知识数据集,包含14,582个问题-答案对,分为1,459个对话。数据来源于多个公开许可的心理健康相关教材,遵循相应的非商业Creative Commons许可证。
This dataset is a knowledge dataset specifically designed for offline mobile conversational robots targeting mental health support. It contains 14,582 question-answer pairs, which are categorized into 1,459 conversations. The data is sourced from multiple publicly licensed mental health-related textbooks, and complies with the corresponding non-commercial Creative Commons license.
创建时间:
2025-11-09
原始信息汇总
Mental Health Knowledge Dataset 数据集概述
基本信息
- 许可证: CC-BY-NC-SA-4.0
- 语言: 英语
- 数据文件: Knowleadge_dataset.json
数据内容
- 包含14,582个问答对
- 分组为1,459个对话式问答对话
数据来源
数据集基于以下公开许可的心理学教材构建:
- Neuroscience, Psychology and Conflict Management (2024) - CC BY-NC 4.0
- Fundamentals of Psychological Disorders (3rd Edition) (2024) - CC BY-NC-SA 4.0
- Principles of Social Psychology (1st International H5P Edition) (2022) - CC BY-NC-SA 4.0
- Essentials of Exercise and Sport Psychology: An Open Access Textbook (2021) - CC BY 4.0
- Psychology 2e (2014) - CC BY 4.0
- Essentials of Cognitive Psychology (2023) - CC BY-NC-SA 4.0
- Abnormal Psychology (2020) - CC BY-NC-SA 4.0
- Psychology: The Science of Human Potential (2019) - CC BY 4.0
使用限制
- 仅限学术、非临床和非商业研究用途
- 不得用作诊断、临床建议或治疗工具
- 作者和贡献者对使用此数据集产生的任何错误、遗漏或结果不承担责任
搜集汇总
数据集介绍

构建方式
在心理健康知识资源整合领域,该数据集通过系统化采集八部遵循知识共享许可协议的心理学开放教材构建而成。编纂团队从神经科学、异常心理学到社会心理学等多元分支中提取核心知识单元,采用人工标注与结构化处理相结合的方式,将原始教材内容转化为14,582组问答对,最终形成1,459组具有逻辑连贯性的对话序列。这种基于权威教材的构建路径既确保了知识体系的专业性,又通过对话式重组增强了知识的可交互性。
特点
该数据集呈现出多维度特征:其知识体系覆盖从基础心理学原理到临床心理障碍的完整谱系,形成层次分明的认知结构。所有内容均标注明确的学术来源与版权许可,构成可溯源的透明知识网络。对话单元设计融合了教育心理学原理,通过渐进式问答展现概念间的关联性。特别值得注意的是,数据集严格遵循非商业研究伦理规范,所有文本均经过伦理审查以避免潜在危害。
使用方法
研究者可借助该数据集开展心理健康对话系统的开发与评估,建议将对话序列按7:2:1的比例划分为训练集、验证集和测试集。使用时应注重对话历史的连贯性建模,利用序列化问答特征进行上下文感知的回复生成。需要特别遵循伦理使用准则,所有衍生应用必须明确标注非临床研究属性,并建立防止误用的保护机制。建议配合心理学专家进行结果验证,确保知识传递的准确性与安全性。
背景与挑战
背景概述
心理健康知识数据集作为数字心理健康领域的重要资源,由多所高校学者于2024年联合构建,整合了八部心理学开放教材的权威内容。该数据集聚焦于构建具备专业知识的对话系统,通过14,582组问答对形成1,459个对话单元,旨在为心理健康支持场景提供可靠的知识基础。其跨教材的知识整合模式显著提升了心理健康教育资源的可及性,为情感计算与心理咨询交叉研究奠定了数据基石。
当前挑战
心理健康领域对话系统面临专业性与安全性的双重挑战:需确保心理学知识的临床准确度与伦理合规性,同时应对非结构化教材知识转化为对话数据的语义对齐难题。在构建过程中,研究者需平衡多源教材的知识密度差异,解决专业术语的通俗化转换问题,并建立严格的内容审核机制以规避诊断性表述,这些因素共同构成了数据集构建的核心技术壁垒。
常用场景
经典使用场景
在心理健康教育领域,该数据集通过14,582组问答对构建了1,459个对话单元,为情感支持型对话系统提供了结构化知识基础。这些源自心理学权威教材的对话数据,常被用于训练具备共情能力的聊天机器人,使其能在模拟对话中融合理论知识与情感回应,为后续交互系统开发奠定核心框架。
衍生相关工作
该数据集启发了多项心理健康对话生成领域的重要研究,例如基于知识增强的情绪支持对话框架、心理学概念嵌入表示方法等。相关成果通过融合教材知识与对话逻辑,显著提升了心理健康对话系统的专业性与安全性,为后续符合伦理规范的AI辅助心理干预研究提供了范式参考。
数据集最近研究
最新研究方向
在心理健康支持领域,基于知识对话的数据集正推动离线移动对话代理的前沿探索。该数据集整合多部心理学权威教材,构建了涵盖神经科学、异常心理学等维度的问答对,为开发非临床场景下的情感交互系统提供结构化知识基础。当前研究聚焦于如何将心理学理论嵌入对话生成模型,以提升代理在压力管理、认知行为引导等任务中的解释性与安全性,同时通过学生中心评估验证其教育支持潜力。这一方向呼应了全球数字心理健康服务对可及性与隐私保护的需求,为开发低资源环境下的辅助工具开辟了新路径。
以上内容由遇见数据集搜集并总结生成



