hlillemark/flores200_eng_scaffolding
收藏Hugging Face2023-03-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hlillemark/flores200_eng_scaffolding
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: source_lang
dtype: string
- name: target_lang
dtype: string
- name: source
dtype: string
- name: target
dtype: string
- name: eng_source
dtype: string
splits:
- name: train
num_bytes: 5588764908
num_examples: 10240000
download_size: 4223075178
dataset_size: 5588764908
---
# Dataset Card for "flores200_eng_scaffolding"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 字段名:id,数据类型:int32
- 字段名:source_lang,数据类型:字符串
- 字段名:target_lang,数据类型:字符串
- 字段名:source,数据类型:字符串
- 字段名:target,数据类型:字符串
- 字段名:eng_source,数据类型:字符串
数据集拆分:
- 拆分名称:train,字节数:5588764908,样本数量:10240000
下载大小:4223075178
数据集存储大小:5588764908
---
# 「flores200_eng_scaffolding」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hlillemark
原始信息汇总
数据集概述
数据集名称
- 名称: flores200_eng_scaffolding
数据集特征
- 特征列表:
- id: 数据类型为 int32
- source_lang: 数据类型为 string
- target_lang: 数据类型为 string
- source: 数据类型为 string
- target: 数据类型为 string
- eng_source: 数据类型为 string
数据集划分
- 训练集:
- 数据大小: 5588764908 字节
- 样本数量: 10240000
数据集大小
- 下载大小: 4223075178 字节
- 总数据大小: 5588764908 字节



