five

mii-llm/text-moderation-translated-it

收藏
Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mii-llm/text-moderation-translated-it
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个主要特征:translated、text和result。result是一个结构体,包含categories、category_scores和flagged三个子特征。categories和category_scores分别包含多个子类别,每个子类别都有对应的布尔类型或浮点类型数据。数据集包含一个训练集,大小为22850100字节,包含69998个样本。

The dataset contains three main features: translated, text, and result. result is a structure that includes three sub-features: categories, category_scores, and flagged. categories and category_scores each contain multiple sub-categories, with each sub-category having corresponding boolean or float data types. The dataset includes a training set with a size of 22850100 bytes and contains 69998 samples.
提供机构:
mii-llm
原始信息汇总

数据集概述

数据集信息

特征

  • translated: 数据类型为字符串。
  • text: 数据类型为字符串。
  • result: 包含以下结构:
    • categories: 包含以下布尔类型字段:
      • harassment
      • harassment-threatening
      • hate
      • hate-threatening
      • self-harm
      • self-harm-instructions
      • self-harm-intent
      • sexual
      • sexual-minors
      • violence
      • violence-graphic
    • category_scores: 包含以下浮点类型字段:
      • harassment
      • harassment-threatening
      • hate
      • hate-threatening
      • self-harm
      • self-harm-instructions
      • self-harm-intent
      • sexual
      • sexual-minors
      • violence
      • violence-graphic
    • flagged: 数据类型为布尔类型。

数据分割

  • train: 包含69998个样本,占用22850100字节。

数据集大小

  • 下载大小: 18195849字节
  • 数据集大小: 22850100字节

配置

  • default: 数据文件路径为data/train-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作