five

mhoualla/school-shooter-dataset

收藏
Hugging Face2024-06-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mhoualla/school-shooter-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
SSDataset汇集了来自学校枪击者的综合文本,这些文本来源于schoolshooters.info网站,并包含丰富的元数据,如原始文档链接、估计的文档创建日期、犯罪者身份以及二元和多类分类标签(人工标注)。此外,还包括非犯罪者的文本,如学生写作和社交媒体帖子,作为模型训练的基线。数据集支持二元和多类分类任务,旨在区分潜在威胁和非威胁的通信,并详细分类文本以理解意图和严重性。该数据集可用于威胁检测、心理分析和执法研究,为开发识别和分类文本中威胁行为的算法提供了详细的框架。

SSDataset汇集了来自学校枪击者的综合文本,这些文本来源于schoolshooters.info网站,并包含丰富的元数据,如原始文档链接、估计的文档创建日期、犯罪者身份以及二元和多类分类标签(人工标注)。此外,还包括非犯罪者的文本,如学生写作和社交媒体帖子,作为模型训练的基线。数据集支持二元和多类分类任务,旨在区分潜在威胁和非威胁的通信,并详细分类文本以理解意图和严重性。该数据集可用于威胁检测、心理分析和执法研究,为开发识别和分类文本中威胁行为的算法提供了详细的框架。
提供机构:
mhoualla
原始信息汇总

数据集概述

基本信息

  • 任务类别: 文本分类
  • 语言: 英文
  • 数据集大小: 1K<n<10K

数据集描述

SSDataset 是一个综合性的文本数据集,主要来源于 schoolshooters.info,包含了学校枪击事件相关文本及其丰富的元数据。元数据包括原始文档链接、估计的文档创建日期、犯罪者身份以及人工标注的二元和多类别分类标签。此外,数据集还包含非犯罪者的文本,如学生写作和社交媒体帖子,用于模型训练的基准。

分类任务

二元分类

  • 0: 非威胁性
  • 1: 威胁性

二元分类任务旨在区分潜在威胁性和非威胁性的通信。

多类别分类

  • Vague Discontent: 非特定的不满或挫折感
  • Grievance Airring: 具体的抱怨,但没有直接威胁
  • Ideation of Violence: 暴力的一般想法,没有具体计划
  • Specific Threats: 直接威胁,没有详细计划
  • Planned Violence: 明确的暴力计划或意图
  • Non-Threatening: 与二元分类中的0相同

应用领域

SSDataset 支持威胁检测、心理分析和执法研究,提供了一个详细的框架,用于开发算法以识别和分类文本中的威胁行为。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作