five

aya_dataset_dutch_example

收藏
魔搭社区2025-12-05 更新2025-07-12 收录
下载链接:
https://modelscope.cn/datasets/data-is-better-together/aya_dataset_dutch_example
下载链接
链接失效反馈
官方服务:
资源简介:
dataset_info: features: - name: inputs dtype: string - name: targets dtype: string - name: language dtype: string - name: language_code dtype: string - name: annotation_type dtype: string - name: user_id dtype: string splits: - name: train num_bytes: 2054479.0656496773 num_examples: 1633 - name: test num_bytes: 125810.10812306659 num_examples: 100 download_size: 672315 dataset_size: 2180289.173772744 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* license: apache-2.0 task_categories: - text-generation language: - nl tags: - sft size_categories: - 1K<n<10K ---

数据集详情: 特征字段: - 字段名:inputs,数据类型:字符串 - 字段名:targets,数据类型:字符串 - 字段名:language,数据类型:字符串 - 字段名:language_code,数据类型:字符串 - 字段名:annotation_type,数据类型:字符串 - 字段名:user_id,数据类型:字符串 数据集划分: - 划分名称:train(训练集),字节大小:2054479.0656496773,样本数量:1633 - 划分名称:test(测试集),字节大小:125810.10812306659,样本数量:100 下载大小:672315 数据集总大小:2180289.173772744 配置项: - 配置名称:default(默认配置),数据文件: - 数据集划分:train(训练集),文件路径:data/train-* - 数据集划分:test(测试集),文件路径:data/test-* 开源许可证:Apache 2.0 任务类别: - 文本生成(Text Generation) 支持语言: - 荷兰语(nl,ISO 639-1代码) 标签: - 监督微调(Supervised Fine-Tuning,SFT) 样本规模区间: - 1000 < 样本量 < 10000
提供机构:
maas
创建时间:
2025-07-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作