mii-llm/text-moderation-translated-it
收藏Hugging Face2024-06-17 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mii-llm/text-moderation-translated-it
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:translated、text和result。result是一个结构体,包含categories、category_scores和flagged三个子特征。categories和category_scores分别包含多个子类别,每个子类别都有对应的布尔类型或浮点类型数据。数据集包含一个训练集,大小为22850100字节,包含69998个样本。
The dataset contains three main features: translated, text, and result. result is a structure that includes three sub-features: categories, category_scores, and flagged. categories and category_scores each contain multiple sub-categories, with each sub-category having corresponding boolean or float data types. The dataset includes a training set with a size of 22850100 bytes and contains 69998 samples.
提供机构:
mii-llm
原始信息汇总
数据集概述
数据集信息
特征
- translated: 数据类型为字符串。
- text: 数据类型为字符串。
- result: 包含以下结构:
- categories: 包含以下布尔类型字段:
- harassment
- harassment-threatening
- hate
- hate-threatening
- self-harm
- self-harm-instructions
- self-harm-intent
- sexual
- sexual-minors
- violence
- violence-graphic
- category_scores: 包含以下浮点类型字段:
- harassment
- harassment-threatening
- hate
- hate-threatening
- self-harm
- self-harm-instructions
- self-harm-intent
- sexual
- sexual-minors
- violence
- violence-graphic
- flagged: 数据类型为布尔类型。
- categories: 包含以下布尔类型字段:
数据分割
- train: 包含69998个样本,占用22850100字节。
数据集大小
- 下载大小: 18195849字节
- 数据集大小: 22850100字节
配置
- default: 数据文件路径为
data/train-*。
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



