five

LinguaLift/IndicMMLUPro-Translated-English

收藏
Hugging Face2024-07-09 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/LinguaLift/IndicMMLUPro-Translated-English
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含 IndicMMLU 专业翻译回英语的评估数据,涵盖以下语言:Hindi、Gujarati 和 Tamil。

This dataset contains the IndicMMLU pro translated back to English in order to evaluate the quality. It contains the following languages: Hindi, Gujarati, and Tamil.
提供机构:
LinguaLift
原始信息汇总

IndicMMLUPro Dataset

概述

  • 数据集名称: IndicMMLUPro Dataset
  • 数据集用途: 用于评估翻译质量
  • 包含语言:
    • 印地语 (Hindi)
    • 古吉拉特语 (Gujarati)
    • 泰米尔语 (Tamil)

数据配置

  • 古吉拉特语 (Gujarati):
    • 验证集: data/gujarati/validation/*.arrow
    • 测试集: data/gujarati/test/*.arrow
  • 印地语 (Hindi):
    • 验证集: data/hindi/validation/*.arrow
    • 测试集: data/hindi/test/*.arrow
  • 泰米尔语 (Tamil):
    • 验证集: data/tamil/validation/*.arrow
    • 测试集: data/tamil/test/*.arrow
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作