five

d0rj/toxic_dvach_detoxified

收藏
Hugging Face2023-06-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/d0rj/toxic_dvach_detoxified
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是[marriamaslova/toxic_dvach]的一个有毒子集,包含了一个通过[s-nlp/ruT5-base-detox]模型生成的去毒列。数据集包含评论、有毒程度和去毒评论三个特征,主要用于文本到文本生成任务。

This dataset is a toxic subset of [marriamaslova/toxic_dvach], which contains a detoxified column generated by the [s-nlp/ruT5-base-detox] model. The dataset includes three features: comments, toxicity levels, and detoxified comments, and is primarily used for text-to-text generation tasks.
提供机构:
d0rj
原始信息汇总

数据集概述

基本信息

数据结构

  • 特征:
    • comment: 字符串类型
    • toxic: 浮点数类型
    • detox: 字符串类型

数据划分

  • 训练集:
    • 数据量: 4826 条
    • 大小: 1798429 字节

数据大小

  • 下载大小: 1036706 字节
  • 数据集大小: 1798429 字节

语言与多语言性

  • 语言: 俄语 (ru)
  • 多语言性: 单语种

规模

  • 数据集规模: 10K<n<100K

标签

  • 标签:
    • 人类反馈
    • 奖励
    • 毒性

任务类别

  • 任务类别: 文本到文本生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作