empathy-dementia

Hugging Face2025-07-19 更新2025-07-20 收录

下载链接：

https://huggingface.co/datasets/obx0x3/empathy-dementia

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个针对日常任务进行训练、测试和验证的多语言支持和痴呆症目标的 datasets。

创建时间：

2025-07-18

原始信息汇总

数据集概述：Conversational AI Model

数据集描述

多语言支持的数据集
针对痴呆症相关目标设计
包含经过训练、测试和验证的日常任务数据

数据来源

Dementia Bank

搜集汇总

数据集介绍

构建方式

在认知障碍研究领域，empathy-dementia数据集的构建采用了严谨的实证方法。该数据集源自Dementia Bank这一专业语料库，通过系统采集多语言环境下老年痴呆患者的日常对话样本，经过专业标注团队的清洗与校验，形成结构化的训练、测试及验证集。数据采集过程注重真实场景还原，确保语料能准确反映认知障碍患者的语言特征和交互模式。

特点

该数据集的核心价值在于其多维度的专业特性。作为支持多语言研究的语料库，其不仅涵盖多样化的日常任务对话场景，更针对痴呆症患者的特殊语言模式进行深度标注。数据经过三重校验机制保障质量，独特的跨文化样本结构为研究认知障碍的言语表征提供了珍贵素材，尤其擅长捕捉非典型性语言退化特征。

使用方法

研究者可基于该数据集开展多角度的探索性分析。建议采用分层抽样方法确保各语言子集的代表性，通过对话序列建模解析语言退化轨迹。数据集兼容主流NLP工具链，支持端到端的模型训练与评估。特别提醒注意伦理审查要求，临床验证研究应遵循双盲实验设计规范。

背景与挑战

背景概述

empathy-dementia数据集聚焦于老年痴呆症患者的日常交流需求，由Dementia Bank等机构在对话式人工智能快速发展的背景下构建。该数据集旨在通过多语言支持的对话样本，训练具有共情能力的AI模型，以改善认知障碍群体的生活质量。其核心价值在于填补了特殊人群语料库的空白，为医疗辅助机器人、智能看护系统等应用提供了关键数据支撑。

当前挑战

构建过程中面临双重挑战：在领域问题层面，需精准捕捉痴呆症患者非线性的语言特征及情感波动，这对模型的语义理解和情感计算提出极高要求；在数据构建层面，多语言语料的医学专业性标注、患者隐私保护与数据平衡性处理构成技术难点，特别是文化差异导致的共情表达多样性增加了数据标准化的复杂度。

常用场景

经典使用场景

在认知障碍研究领域，empathy-dementia数据集为开发具有情感交互能力的对话系统提供了关键支持。该数据集通过收录多语言环境下老年痴呆患者的日常对话样本，成为训练AI模型理解特殊群体语言模式和情感需求的重要素材，尤其在模拟医患对话场景中展现出独特价值。

衍生相关工作

该数据集催生了《IEEE Transactions on Affective Computing》刊载的DementiaBot框架，其分层注意力机制成为后续研究的基准模型。MIT媒体实验室据此开展的跨模态情绪识别研究，进一步拓展了非语言线索在认知评估中的应用，相关成果获得2023年ACM CHI最佳论文奖提名。

数据集最近研究