five

Depression Corpus of Arabic tweets

收藏
DataCite Commons2025-05-12 更新2025-05-17 收录
下载链接:
https://dataverse.harvard.edu/citation?persistentId=doi:10.7910/DVN/YHMYEQ
下载链接
链接失效反馈
官方服务:
资源简介:
This is a new Arabic corpus for depression detection from Twitter. This corpus consists of 10.000 tweets classified into 5.000 of 1 which means "depressed" tweets, and 5.000 of 0 which means "non-depressed" tweets. Additionally, the fetched tweets covered a wide range of different synonymous of depression and cheerfulness on Twitter. To our knowledge, this is the first manually annotated Arabic corpus for depression detection from Twitter up to submitting this data.

这是一个用于从Twitter进行抑郁症检测(depression detection)的新型阿拉伯语语料库(corpus)。该语料库包含10,000条推文,其中5,000条被归类为类别1(表示“抑郁”推文),5,000条被归类为类别0(表示“非抑郁”推文)。此外,所获取的推文涵盖了Twitter上抑郁症和愉悦感的多种不同同义词。据我们所知,截至提交本数据时,这是首个用于从Twitter检测抑郁症的人工标注(manually annotated)阿拉伯语语料库。
提供机构:
Harvard Dataverse
创建时间:
2022-12-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作