d0rj/toxic_dvach_detoxified
收藏Hugging Face2023-06-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/toxic_dvach_detoxified
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是[marriamaslova/toxic_dvach]的一个有毒子集,包含了一个通过[s-nlp/ruT5-base-detox]模型生成的去毒列。数据集包含评论、有毒程度和去毒评论三个特征,主要用于文本到文本生成任务。
This dataset is a toxic subset of [marriamaslova/toxic_dvach], which contains a detoxified column generated by the [s-nlp/ruT5-base-detox] model. The dataset includes three features: comments, toxicity levels, and detoxified comments, and is primarily used for text-to-text generation tasks.
提供机构:
d0rj
原始信息汇总
数据集概述
基本信息
- 数据集名称: toxic_dvach_detoxified
- 来源: 基于 marriamaslova/toxic_dvach 数据集,通过 s-nlp/ruT5-base-detox 模型处理得到。
数据结构
- 特征:
comment: 字符串类型toxic: 浮点数类型detox: 字符串类型
数据划分
- 训练集:
- 数据量: 4826 条
- 大小: 1798429 字节
数据大小
- 下载大小: 1036706 字节
- 数据集大小: 1798429 字节
语言与多语言性
- 语言: 俄语 (
ru) - 多语言性: 单语种
规模
- 数据集规模: 10K<n<100K
标签
- 标签:
- 人类反馈
- 奖励
- 毒性
任务类别
- 任务类别: 文本到文本生成



