IWSLT/mt_eng_vietnamese
收藏数据集卡片 for mt_eng_vietnamese
数据集描述
数据集摘要
预处理的数据集来自 IWSLT15 英语-越南语机器翻译:英语-越南语。
支持的任务和排行榜
机器翻译
语言
英语, 越南语
数据集结构
数据实例
数据集中的一个示例: json { "translation": { "en": "In 4 minutes, atmospheric chemist Rachel Pike provides a glimpse of the massive scientific effort behind the bold headlines on climate change, with her team -- one of thousands who contributed -- taking a risky flight over the rainforest in pursuit of data on a key molecule.", "vi": "Trong 4 phút, chuyên gia hoá học khí quyển Rachel Pike giới thiệu sơ lược về những nỗ lực khoa học miệt mài đằng sau những tiêu đề táo bạo về biến đổi khí hậu, cùng với đoàn nghiên cứu của mình -- hàng ngàn người đã cống hiến cho dự án này -- một chuyến bay mạo hiểm qua rừng già để tìm kiếm thông tin về một phân tử then chốt." } }
数据字段
- translation:
- en: 英语文本
- vi: 越南语文本
数据分割
- train: 133318
- validation: 1269
- test: 1269
数据集创建
数据集信息
-
config_name: iwslt2015-vi-en
- features:
- name: translation dtype: translation: languages: - vi - en
- splits:
- name: train num_bytes: 32478282 num_examples: 133318
- name: validation num_bytes: 323743 num_examples: 1269
- name: test num_bytes: 323743 num_examples: 1269
- download_size: 32323025
- dataset_size: 33125768
- features:
-
config_name: iwslt2015-en-vi
- features:
- name: translation dtype: translation: languages: - en - vi
- splits:
- name: train num_bytes: 32478282 num_examples: 133318
- name: validation num_bytes: 323743 num_examples: 1269
- name: test num_bytes: 323743 num_examples: 1269
- download_size: 32323025
- dataset_size: 33125768
- features:




