HU-Berlin-ML-Internal/toxicity-dataset
收藏Hugging Face2024-06-11 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/HU-Berlin-ML-Internal/toxicity-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和标签两个特征,标签分为non-toxic(非有害)和toxic(有害)两类。数据集分为训练集和测试集,训练集包含8513个样本,测试集包含1065个样本。数据集的总下载大小为1920913字节,总数据集大小为2822360字节。
该数据集包含文本和标签两个特征,标签分为non-toxic(非有害)和toxic(有害)两类。数据集分为训练集和测试集,训练集包含8513个样本,测试集包含1065个样本。数据集的总下载大小为1920913字节,总数据集大小为2822360字节。
提供机构:
HU-Berlin-ML-Internal
原始信息汇总
数据集概述
数据集信息
- 特征:
text: 文本数据,数据类型为字符串。label: 标签数据,数据类型为分类标签,包含两个类别:0: non-toxic(非有毒)1: toxic(有毒)
数据集分割
- 训练集:
- 文件大小: 2512167 字节
- 样本数量: 8513
- 测试集:
- 文件大小: 310193 字节
- 样本数量: 1065
数据集大小
- 下载大小: 1920913 字节
- 总数据集大小: 2822360 字节
配置信息
- 配置名称: default
- 数据文件路径:
- 训练集:
data/train-* - 测试集:
data/test-*
- 训练集:
- 数据文件路径:



