SDCNL (Suicide vs Depression Classification)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SDCNL
下载链接
链接失效反馈官方服务:
资源简介:
我们根据我们的自杀或抑郁分类任务开发了一个主要数据集。该数据集是从 Reddit 网络抓取的。我们使用 Python Reddit API 从 subreddits 收集数据。我们专门从两个子版块 r/SuicideWatch3 和 r/Depression 中抓取。该数据集总共包含 1,895 个帖子。我们利用抓取数据中的两个字段:帖子的原始文本作为我们的输入,它所属的 subreddit 作为标签。来自 r/SuicideWatch 的帖子被标记为自杀,来自 r/Depression 的帖子被标记为抑郁。我们在我们的代码中提供了这个数据集和网络抓取脚本。
We developed a core dataset for our suicide or depression classification task. This dataset was scraped from the Reddit platform. We collected data from subreddits using the Python Reddit API. Specifically, we scraped data from two subreddits: r/SuicideWatch3 and r/Depression. The dataset contains a total of 1,895 posts. We utilized two fields from the scraped data: the original post text as our model input, and the associated subreddit as the classification label. Posts from r/SuicideWatch3 were labeled as suicide-related, while posts from r/Depression were labeled as depression-related. We have provided both this dataset and the web scraping script in our accompanying code.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
SDCNL数据集是一个用于自杀与抑郁分类任务的文本数据集,包含从Reddit的r/SuicideWatch和r/Depression子版块抓取的1,895个帖子,其中帖子的原始文本作为输入,所属子版块作为标签。该数据集附带网络抓取脚本,旨在支持相关研究。
以上内容由遇见数据集搜集并总结生成



