five

empathy-dementia

收藏
Hugging Face2025-07-19 更新2025-07-20 收录
下载链接:
https://huggingface.co/datasets/obx0x3/empathy-dementia
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个针对日常任务进行训练、测试和验证的多语言支持和痴呆症目标的 datasets。
创建时间:
2025-07-18
原始信息汇总

数据集概述:Conversational AI Model

数据集描述

  • 多语言支持的数据集
  • 针对痴呆症相关目标设计
  • 包含经过训练、测试和验证的日常任务数据

数据来源

  • Dementia Bank
搜集汇总
数据集介绍
main_image_url
构建方式
在认知障碍研究领域,empathy-dementia数据集的构建采用了严谨的实证方法。该数据集源自Dementia Bank这一专业语料库,通过系统采集多语言环境下老年痴呆患者的日常对话样本,经过专业标注团队的清洗与校验,形成结构化的训练、测试及验证集。数据采集过程注重真实场景还原,确保语料能准确反映认知障碍患者的语言特征和交互模式。
特点
该数据集的核心价值在于其多维度的专业特性。作为支持多语言研究的语料库,其不仅涵盖多样化的日常任务对话场景,更针对痴呆症患者的特殊语言模式进行深度标注。数据经过三重校验机制保障质量,独特的跨文化样本结构为研究认知障碍的言语表征提供了珍贵素材,尤其擅长捕捉非典型性语言退化特征。
使用方法
研究者可基于该数据集开展多角度的探索性分析。建议采用分层抽样方法确保各语言子集的代表性,通过对话序列建模解析语言退化轨迹。数据集兼容主流NLP工具链,支持端到端的模型训练与评估。特别提醒注意伦理审查要求,临床验证研究应遵循双盲实验设计规范。
背景与挑战
背景概述
empathy-dementia数据集聚焦于老年痴呆症患者的日常交流需求,由Dementia Bank等机构在对话式人工智能快速发展的背景下构建。该数据集旨在通过多语言支持的对话样本,训练具有共情能力的AI模型,以改善认知障碍群体的生活质量。其核心价值在于填补了特殊人群语料库的空白,为医疗辅助机器人、智能看护系统等应用提供了关键数据支撑。
当前挑战
构建过程中面临双重挑战:在领域问题层面,需精准捕捉痴呆症患者非线性的语言特征及情感波动,这对模型的语义理解和情感计算提出极高要求;在数据构建层面,多语言语料的医学专业性标注、患者隐私保护与数据平衡性处理构成技术难点,特别是文化差异导致的共情表达多样性增加了数据标准化的复杂度。
常用场景
经典使用场景
在认知障碍研究领域,empathy-dementia数据集为开发具有情感交互能力的对话系统提供了关键支持。该数据集通过收录多语言环境下老年痴呆患者的日常对话样本,成为训练AI模型理解特殊群体语言模式和情感需求的重要素材,尤其在模拟医患对话场景中展现出独特价值。
衍生相关工作
该数据集催生了《IEEE Transactions on Affective Computing》刊载的DementiaBot框架,其分层注意力机制成为后续研究的基准模型。MIT媒体实验室据此开展的跨模态情绪识别研究,进一步拓展了非语言线索在认知评估中的应用,相关成果获得2023年ACM CHI最佳论文奖提名。
数据集最近研究
最新研究方向
在认知障碍辅助诊疗领域,empathy-dementia数据集因其多语言支持和针对痴呆症患者日常任务对话的特性,正推动跨模态人机交互研究的发展。近期工作聚焦于融合情感计算与认知评估模型,通过分析对话中的语义连贯性和情感波动特征,构建早期筛查的数字生物标记。该数据集与剑桥大学临床医学院开展的远程监测项目形成方法论互补,为轻量化边缘计算设备提供本土化语言适配方案,显著提升了非英语社区居家护理的可及性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作