five

mteb/flores

收藏
Hugging Face2025-05-04 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mteb/flores
下载链接
链接失效反馈
官方服务:
资源简介:
FloresBitextMining是一个用于机器翻译的基准数据集,专注于英语与低资源语言之间的翻译。它包含多种非虚构和百科全书式的书面文本。这个数据集是MTEB(Massive Text Embedding Benchmark)的一部分,用于评估机器翻译模型在低资源语言上的表现。

FloresBitextMining is a benchmark dataset for machine translation focusing on the translation between English and low-resource languages. It includes a variety of non-fiction and encyclopedic written texts. This dataset is part of MTEB (Massive Text Embedding Benchmark) and is used to evaluate machine translation models on low-resource languages.
提供机构:
mteb
原始信息汇总

数据集概述

配置信息

  • 配置名称: default
  • 数据文件:
    • 分割类型: dev
      • 文件路径: dev.parquet
    • 分割类型: devtest
      • 文件路径: devtest.parquet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作