bayes-group-diffusion/paradetox
收藏Hugging Face2024-07-02 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/bayes-group-diffusion/paradetox
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含英文的有毒评论和中性评论,分为训练集、验证集和测试集。训练集包含15795个样本,验证集包含1974个样本,测试集包含1975个样本。数据集的总大小为2155391.0字节,下载大小为1492963字节。
This dataset contains English toxic comments and neutral comments, divided into training, validation, and test sets. The training set contains 15795 samples, the validation set contains 1974 samples, and the test set contains 1975 samples. The total size of the dataset is 2155391.0 bytes, and the download size is 1492963 bytes.
提供机构:
bayes-group-diffusion
原始信息汇总
数据集概述
数据特征
- en_toxic_comment: 类型为字符串
- en_neutral_comment: 类型为字符串
数据集划分
- train: 包含15795个样本,大小为1724290.9666227715字节
- validation: 包含1974个样本,大小为215495.43324554295字节
- test: 包含1975个样本,大小为215604.60013168558字节
数据集大小
- 下载大小: 1492963字节
- 总大小: 2155391.0字节
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- data_files:



