mii-llm/text-moderation-translated-it

Name: mii-llm/text-moderation-translated-it
Creator: mii-llm
Published: 2024-06-17 19:41:19
License: 暂无描述

Hugging Face2024-06-17 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/mii-llm/text-moderation-translated-it

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要特征：translated、text和result。result是一个结构体，包含categories、category_scores和flagged三个子特征。categories和category_scores分别包含多个子类别，每个子类别都有对应的布尔类型或浮点类型数据。数据集包含一个训练集，大小为22850100字节，包含69998个样本。

The dataset contains three main features: translated, text, and result. result is a structure that includes three sub-features: categories, category_scores, and flagged. categories and category_scores each contain multiple sub-categories, with each sub-category having corresponding boolean or float data types. The dataset includes a training set with a size of 22850100 bytes and contains 69998 samples.

提供机构：

mii-llm

原始信息汇总

数据集概述

数据集信息

特征

translated: 数据类型为字符串。
text: 数据类型为字符串。
result: 包含以下结构：
- categories: 包含以下布尔类型字段：
  - harassment
  - harassment-threatening
  - hate
  - hate-threatening
  - self-harm
  - self-harm-instructions
  - self-harm-intent
  - sexual
  - sexual-minors
  - violence
  - violence-graphic
- category_scores: 包含以下浮点类型字段：
  - harassment
  - harassment-threatening
  - hate
  - hate-threatening
  - self-harm
  - self-harm-instructions
  - self-harm-intent
  - sexual
  - sexual-minors
  - violence
  - violence-graphic
- flagged: 数据类型为布尔类型。

数据分割

train: 包含69998个样本，占用22850100字节。

数据集大小

下载大小: 18195849字节
数据集大小: 22850100字节

配置

default: 数据文件路径为data/train-*。

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集