five

CAMS

收藏
github2022-12-26 更新2024-05-31 收录
下载链接:
https://github.com/drmuskangarg/CAMS
下载链接
链接失效反馈
官方服务:
资源简介:
CAMS是一个用于社交媒体上心理健康因果分析的标注数据集。该数据集包括两种类型的标注:因果解释和因果分类。通过爬取和标注3155条Reddit数据以及重新标注公开的SDCNL数据集中的1896个实例,展示了其标注方案的有效性,并将这些数据合并为CAMS数据集。

CAMS is an annotated dataset designed for causal analysis of mental health on social media. The dataset comprises two types of annotations: causal explanations and causal classifications. By scraping and annotating 3155 Reddit posts and re-annotating 1896 instances from the publicly available SDCNL dataset, the effectiveness of its annotation scheme is demonstrated, and these data are combined to form the CAMS dataset.
创建时间:
2022-01-08
原始信息汇总

CAMS数据集概述

数据集名称

  • CAMS: An Annotated Corpus for Causal Analysis of Mental Health Issues in Social Media Posts

数据集目的

  • 用于心理健康问题在社交媒体帖子中的因果分析研究。

数据集内容

  • 包含两种类型的标注:因果解释和因果分类。
  • 数据集由两部分组成:
    • 爬取并标注的3155条Reddit数据。
    • 重新标注的公开SDCNL数据集中的1896个实例。

数据集下载

  • 标注数据可从此处下载。

使用条款

  • 该语料库可自由用于研究目的。
  • 使用该语料库时,请引用相关论文。
  • 欢迎通过电子邮件提供反馈或分享使用情况,以及探讨合作研究项目。
搜集汇总
数据集介绍
main_image_url
构建方式
CAMS数据集的构建过程体现了对社交媒体中精神健康问题因果分析的深入探索。研究团队首先设计了一套详尽的注释框架,涵盖因果解释和因果分类两大核心要素。通过爬取并标注3155条Reddit数据,以及重新标注1896条公开的SDCNL数据集实例,确保了数据的多样性和代表性。最终,这些数据被整合为CAMS数据集,为精神健康领域的因果分析提供了坚实的基础。
特点
CAMS数据集的特点在于其专注于社交媒体文本中的精神健康问题因果分析,具有高度的专业性和针对性。数据集不仅包含了丰富的Reddit数据,还整合了经过重新标注的SDCNL数据集,确保了数据的广度和深度。注释框架的设计科学严谨,涵盖了因果解释和因果分类两大维度,为研究者提供了多维度的分析视角。此外,数据集的公开性和可访问性也为相关领域的研究提供了便利。
使用方法
CAMS数据集的使用方法简便且灵活,研究者可通过GitHub页面下载标注数据。数据集适用于精神健康领域的因果分析研究,尤其适合用于社交媒体文本的深度挖掘。使用过程中,建议参考原始论文中的注释框架和分析方法,以确保研究的科学性和准确性。研究者可根据需求对数据进行进一步处理和分析,同时鼓励在发表研究成果时引用原始论文,以支持数据集的持续发展和改进。
背景与挑战
背景概述
CAMS数据集由研究人员在2022年创建,旨在支持社交媒体帖子中心理健康问题的因果分析研究。该数据集由3155条Reddit数据和1896条来自公开数据集SDCNL的实例组成,经过重新注释以支持可解释的因果分析。CAMS的注释框架包括因果解释和因果分类两部分,为心理健康领域的因果分析提供了新的研究工具。该数据集在语言资源与评估会议(LREC 2022)上发表,标志着社交媒体数据在心理健康研究中的应用迈出了重要一步。
当前挑战
CAMS数据集在构建过程中面临多重挑战。首先,社交媒体数据的多样性和复杂性使得因果关系的标注变得尤为困难,尤其是在心理健康领域,文本中隐含的因果关系往往需要高度专业的知识进行解读。其次,数据集的构建需要平衡数据的代表性和隐私保护,特别是在处理敏感的心理健康话题时。此外,如何确保标注的一致性和准确性也是构建过程中的一大难题,尤其是在跨数据集整合时,不同来源的数据可能存在标注标准的差异。这些挑战不仅影响了数据集的构建效率,也对后续研究的可靠性和可重复性提出了更高的要求。
常用场景
经典使用场景
CAMS数据集专为社交媒体帖子中的心理健康问题因果分析而设计,广泛应用于自然语言处理领域。研究者利用该数据集进行因果解释和因果分类的标注,深入探讨社交媒体中用户表达的心理健康问题的成因及其影响。通过分析Reddit平台上的3155条数据和SDCNL数据集的1896个实例,CAMS为心理健康研究提供了丰富的数据支持。
衍生相关工作
CAMS数据集的发布催生了一系列相关研究,特别是在心理健康与自然语言处理的交叉领域。基于CAMS的研究工作包括开发新的因果分析算法、改进心理健康问题的自动检测模型,以及探索社交媒体数据在心理健康监测中的应用。这些研究不仅扩展了CAMS的应用范围,还推动了心理健康领域的学术进展。
数据集最近研究
最新研究方向
在心理健康与社交媒体交互的交叉领域,CAMS数据集为研究者提供了一个全新的视角,专注于社交媒体帖子中心理健康问题的因果分析。该数据集通过精心设计的注释方案,包括因果解释和因果分类,使得研究者能够深入探索社交媒体内容与心理健康状态之间的复杂关系。最近的研究方向集中在利用CAMS数据集开发更精确的自然语言处理模型,以自动识别和分类社交媒体中的心理健康相关言论,进而为心理健康监测和干预提供数据支持。此外,该数据集还被用于研究社交媒体环境对个体心理健康的影响,以及如何通过技术手段改善这一影响,具有重要的社会意义和实际应用价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作