blueapple8259/c4-ko-cleaned-2
收藏Hugging Face2024-07-07 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/blueapple8259/c4-ko-cleaned-2
下载链接
链接失效反馈官方服务:
资源简介:
这是一个改进自之前数据集(blueapple8259/c4-ko-cleaned)的新数据集,原始数据集为allenai/c4。数据集的规模为约10GB,包含2,261,464条数据。数据集的语言为韩语(ko),任务类别为文本生成(text-generation)。
This dataset is an improvement over the previous version (c4-ko-cleaned), primarily used for text generation tasks. The original dataset is from c4, with a file size of approximately 10GB, containing 2261464 data entries.
提供机构:
blueapple8259
原始信息汇总
数据集概述
许可证
- 许可证类型: odc-by
语言
- 语言: 韩语 (ko)
任务类别
- 任务类别: 文本生成
数据集来源
- 原始数据集: c4
数据集信息
- 文件大小: 约 10GB
- 数据数量: 2261464



