4n3mone/aya_collection_korean
收藏Hugging Face2024-06-14 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/4n3mone/aya_collection_korean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是从CohereForAI/aya_collection_language_split中提取的韩语部分数据集。数据集中包含多个来源的数据集,部分数据集是翻译版本。数据集的特征包括id、inputs、targets、dataset_name、sub_dataset_name、task_type、template_id、language、script和split。数据集分为train、validation和test三个部分,分别包含3605894、276202和279418个样本。数据集的下载大小为1147896919字节,总大小为2549533942字节。
提供机构:
4n3mone
原始信息汇总
数据集概述
数据集信息
-
特征列表:
id: 类型int64inputs: 类型stringtargets: 类型stringdataset_name: 类型stringsub_dataset_name: 类型stringtask_type: 类型stringtemplate_id: 类型int64language: 类型stringscript: 类型stringsplit: 类型string
-
数据分割:
train: 字节数2164270878, 样本数3605894validation: 字节数182708679, 样本数276202test: 字节数202554385, 样本数279418
-
数据大小:
- 下载大小:
1147896919字节 - 数据集大小:
2549533942字节
- 下载大小:
配置信息
- 默认配置:
- 数据文件路径:
train:data/train-*validation:data/validation-*test:data/test-*
- 数据文件路径:
许可信息
- 许可证:
apache-2.0
语言信息
- 支持语言:
ko(韩语)



