HamdanXI/paradetox-refined-dataset
收藏Hugging Face2023-12-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HamdanXI/paradetox-refined-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要特征:英文有毒评论、英文中性评论、编辑操作序列和掩码评论。数据集分为一个训练集,包含19744个样本,文件大小为5592956字节。下载大小为2314734字节,数据集总大小为5592956字节。
该数据集包含四个主要特征:英文有毒评论、英文中性评论、编辑操作序列和掩码评论。数据集分为一个训练集,包含19744个样本,文件大小为5592956字节。下载大小为2314734字节,数据集总大小为5592956字节。
提供机构:
HamdanXI
原始信息汇总
数据集概述
特征信息
- en_toxic_comment: 类型为字符串。
- en_neutral_comment: 类型为字符串。
- edit_ops: 类型为字符串序列。
- masked_comment: 类型为字符串。
数据分割
- train: 包含19744个样本,总字节数为5592956。
数据集大小
- 下载大小: 2314734字节。
- 数据集大小: 5592956字节。
配置信息
- default: 包含训练数据文件,路径为
data/train-*。



