narySt/text_detoxification_dataset

Name: narySt/text_detoxification_dataset
Creator: narySt
Published: 2023-10-29 19:05:08
License: 暂无描述

Hugging Face2023-10-29 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/narySt/text_detoxification_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，如翻译文本、参考文本、相似度、长度差异、毒性评分等。数据集主要用于训练，包含577,777个样本，总大小为106,169,417字节。数据集的配置信息表明，训练数据存储在指定路径下。

提供机构：

narySt

原始信息汇总

数据集概述

config_name: default
- data_files:
  - split: train
  - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集