five

lihaoxin2020/ki-lmeval-deepseek-reasoner-on-mmlu_pro-0shot_cot-scillm-b330c24d48

收藏
Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/lihaoxin2020/ki-lmeval-deepseek-reasoner-on-mmlu_pro-0shot_cot-scillm-b330c24d48
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: biology features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1420945 num_examples: 200 download_size: 1337773 dataset_size: 1420945 - config_name: chemistry features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1239598 num_examples: 200 download_size: 1155926 dataset_size: 1239598 - config_name: computer science features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1231345 num_examples: 200 download_size: 1167147 dataset_size: 1231345 - config_name: engineering features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1426990 num_examples: 200 download_size: 1326862 dataset_size: 1426990 - config_name: health features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1473394 num_examples: 200 download_size: 1383372 dataset_size: 1473394 - config_name: math features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1052974 num_examples: 200 download_size: 983395 dataset_size: 1052974 - config_name: physics features: - name: data list: - name: content dtype: string - name: role dtype: string - name: raw_response struct: - name: text dtype: string - name: raw_text dtype: string - name: knowledge_pieces list: string - name: doc_id dtype: int64 - name: native_id dtype: int64 splits: - name: train num_bytes: 1196930 num_examples: 200 download_size: 1118169 dataset_size: 1196930 configs: - config_name: biology data_files: - split: train path: biology/train-* - config_name: chemistry data_files: - split: train path: chemistry/train-* - config_name: computer science data_files: - split: train path: computer science/train-* - config_name: engineering data_files: - split: train path: engineering/train-* - config_name: health data_files: - split: train path: health/train-* - config_name: math data_files: - split: train path: math/train-* - config_name: physics data_files: - split: train path: physics/train-* ---

数据集信息: - 配置名称:生物学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1420945 样本数量:200 下载大小:1337773 数据集存储大小:1420945 - 配置名称:化学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1239598 样本数量:200 下载大小:1155926 数据集存储大小:1239598 - 配置名称:计算机科学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1231345 样本数量:200 下载大小:1167147 数据集存储大小:1231345 - 配置名称:工程学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1426990 样本数量:200 下载大小:1326862 数据集存储大小:1426990 - 配置名称:健康科学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1473394 样本数量:200 下载大小:1383372 数据集存储大小:1473394 - 配置名称:数学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1052974 样本数量:200 下载大小:983395 数据集存储大小:1052974 - 配置名称:物理学 特征: - 字段名称:data,列表类型,包含: - 子字段:content,数据类型:字符串(string) - 子字段:role,数据类型:字符串(string) - 字段名称:raw_response,结构体类型,包含: - 子字段:text,数据类型:字符串(string) - 字段名称:raw_text,数据类型:字符串(string) - 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string) - 字段名称:doc_id,数据类型:64位整数(int64) - 字段名称:native_id,数据类型:64位整数(int64) 数据集划分: - 划分名称:训练集(train) 字节数:1196930 样本数量:200 下载大小:1118169 数据集存储大小:1196930 配置项: - 配置名称:生物学 数据文件: - 划分:训练集(train) 文件路径:biology/train-* - 配置名称:化学 数据文件: - 划分:训练集(train) 文件路径:chemistry/train-* - 配置名称:计算机科学 数据文件: - 划分:训练集(train) 文件路径:computer science/train-* - 配置名称:工程学 数据文件: - 划分:训练集(train) 文件路径:engineering/train-* - 配置名称:健康科学 数据文件: - 划分:训练集(train) 文件路径:health/train-* - 配置名称:数学 数据文件: - 划分:训练集(train) 文件路径:math/train-* - 配置名称:物理学 数据文件: - 划分:训练集(train) 文件路径:physics/train-*
提供机构:
lihaoxin2020
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作