oriki101/mc4_ja_text_volume_annotatted_data

Name: oriki101/mc4_ja_text_volume_annotatted_data
Creator: oriki101
Published: 2024-01-01 13:00:00
License: 暂无描述

Hugging Face2024-01-01 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/oriki101/mc4_ja_text_volume_annotatted_data

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是对mC4的日语数据进行人工评估的结果，评估标准是根据文本中句子的比例进行1到5级的评分，评分结果存储在数据集的score字段中。数据集的样本量为500件，旨在帮助清理mC4中的低质量数据。

提供机构：

oriki101

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集