mhoualla/school-shooter-dataset
收藏Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mhoualla/school-shooter-dataset
下载链接
链接失效反馈官方服务:
资源简介:
SSDataset汇集了来自学校枪击者的综合文本,这些文本来源于schoolshooters.info网站,并包含丰富的元数据,如原始文档链接、估计的文档创建日期、犯罪者身份以及二元和多类分类标签(人工标注)。此外,还包括非犯罪者的文本,如学生写作和社交媒体帖子,作为模型训练的基线。数据集支持二元和多类分类任务,旨在区分潜在威胁和非威胁的通信,并详细分类文本以理解意图和严重性。该数据集可用于威胁检测、心理分析和执法研究,为开发识别和分类文本中威胁行为的算法提供了详细的框架。
SSDataset汇集了来自学校枪击者的综合文本,这些文本来源于schoolshooters.info网站,并包含丰富的元数据,如原始文档链接、估计的文档创建日期、犯罪者身份以及二元和多类分类标签(人工标注)。此外,还包括非犯罪者的文本,如学生写作和社交媒体帖子,作为模型训练的基线。数据集支持二元和多类分类任务,旨在区分潜在威胁和非威胁的通信,并详细分类文本以理解意图和严重性。该数据集可用于威胁检测、心理分析和执法研究,为开发识别和分类文本中威胁行为的算法提供了详细的框架。
提供机构:
mhoualla
原始信息汇总
数据集概述
基本信息
- 任务类别: 文本分类
- 语言: 英文
- 数据集大小: 1K<n<10K
数据集描述
SSDataset 是一个综合性的文本数据集,主要来源于 schoolshooters.info,包含了学校枪击事件相关文本及其丰富的元数据。元数据包括原始文档链接、估计的文档创建日期、犯罪者身份以及人工标注的二元和多类别分类标签。此外,数据集还包含非犯罪者的文本,如学生写作和社交媒体帖子,用于模型训练的基准。
分类任务
二元分类
- 0: 非威胁性
- 1: 威胁性
二元分类任务旨在区分潜在威胁性和非威胁性的通信。
多类别分类
- Vague Discontent: 非特定的不满或挫折感
- Grievance Airring: 具体的抱怨,但没有直接威胁
- Ideation of Violence: 暴力的一般想法,没有具体计划
- Specific Threats: 直接威胁,没有详细计划
- Planned Violence: 明确的暴力计划或意图
- Non-Threatening: 与二元分类中的0相同
应用领域
SSDataset 支持威胁检测、心理分析和执法研究,提供了一个详细的框架,用于开发算法以识别和分类文本中的威胁行为。



