frontier-science-multilingual
收藏Hugging Face2026-03-25 更新2026-03-26 收录
下载链接:
https://huggingface.co/datasets/ellamind/frontier-science-multilingual
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含德语(deu)和法语(fra)两个版本,每个版本包含159个测试样本。数据集的主要字段包括:id(唯一标识符)、benchmark(基准名称)、subset(子集名称)、subject(主题)、task_group_id(任务组ID)、problem(问题描述)、answer(答案)、flag_for_review(是否需要审核标记)、review_reason(审核原因)、target_language(目标语言)、translation_confidence(翻译置信度)、translation_notes(翻译备注)、required_adaptation(是否需要适配)、adaptation_notes(适配备注)、preserves_formatting(是否保留格式)。数据集仅包含测试集,德语版本大小为582,707字节,法语版本大小为590,454字节。
提供机构:
ellamind
创建时间:
2026-03-25
原始信息汇总
数据集概述
基本信息
- 数据集名称: frontier-science-multilingual
- 托管地址: https://huggingface.co/datasets/ellamind/frontier-science-multilingual
- 配置数量: 2
- 配置名称: deu, fra
数据集配置详情
配置:deu
- 数据文件路径: deu/test-*
- 数据拆分: test
- 拆分样本数: 159
- 拆分大小(字节): 582,707
- 下载大小(字节): 286,845
- 数据集大小(字节): 582,707
配置:fra
- 数据文件路径: fra/test-*
- 数据拆分: test
- 拆分样本数: 159
- 拆分大小(字节): 590,454
- 下载大小(字节): 280,881
- 数据集大小(字节): 590,454
数据特征
所有配置共享以下特征结构:
- id (large_string): 样本标识符
- benchmark (large_string): 基准信息
- subset (large_string): 子集信息
- subject (large_string): 学科主题
- task_group_id (large_string): 任务组标识符
- problem (large_string): 问题描述
- answer (large_string): 答案
- flag_for_review (bool): 审核标记
- review_reason (large_string): 审核原因
- target_language (large_string): 目标语言
- translation_confidence (large_string): 翻译置信度
- translation_notes (large_string): 翻译备注
- required_adaptation (bool): 是否需要适配
- adaptation_notes (large_string): 适配备注
- preserves_formatting (bool): 是否保留格式



