five

frontier-science-multilingual

收藏
Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/ellamind/frontier-science-multilingual
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含德语(deu)和法语(fra)两个版本,每个版本包含159个测试样本。数据集的主要字段包括:id(唯一标识符)、benchmark(基准名称)、subset(子集名称)、subject(主题)、task_group_id(任务组ID)、problem(问题描述)、answer(答案)、flag_for_review(是否需要审核标记)、review_reason(审核原因)、target_language(目标语言)、translation_confidence(翻译置信度)、translation_notes(翻译备注)、required_adaptation(是否需要适配)、adaptation_notes(适配备注)、preserves_formatting(是否保留格式)。数据集仅包含测试集,德语版本大小为582,707字节,法语版本大小为590,454字节。
提供机构:
ellamind
创建时间:
2026-03-25
原始信息汇总

数据集概述

基本信息

  • 数据集名称: frontier-science-multilingual
  • 托管地址: https://huggingface.co/datasets/ellamind/frontier-science-multilingual
  • 配置数量: 2
  • 配置名称: deu, fra

数据集配置详情

配置:deu

  • 数据文件路径: deu/test-*
  • 数据拆分: test
  • 拆分样本数: 159
  • 拆分大小(字节): 582,707
  • 下载大小(字节): 286,845
  • 数据集大小(字节): 582,707

配置:fra

  • 数据文件路径: fra/test-*
  • 数据拆分: test
  • 拆分样本数: 159
  • 拆分大小(字节): 590,454
  • 下载大小(字节): 280,881
  • 数据集大小(字节): 590,454

数据特征

所有配置共享以下特征结构:

  • id (large_string): 样本标识符
  • benchmark (large_string): 基准信息
  • subset (large_string): 子集信息
  • subject (large_string): 学科主题
  • task_group_id (large_string): 任务组标识符
  • problem (large_string): 问题描述
  • answer (large_string): 答案
  • flag_for_review (bool): 审核标记
  • review_reason (large_string): 审核原因
  • target_language (large_string): 目标语言
  • translation_confidence (large_string): 翻译置信度
  • translation_notes (large_string): 翻译备注
  • required_adaptation (bool): 是否需要适配
  • adaptation_notes (large_string): 适配备注
  • preserves_formatting (bool): 是否保留格式
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作