lihaoxin2020/ki-lmeval-deepseek-reasoner-on-mmlu_pro-0shot_cot-scillm-b330c24d48
收藏Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/lihaoxin2020/ki-lmeval-deepseek-reasoner-on-mmlu_pro-0shot_cot-scillm-b330c24d48
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: biology
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1420945
num_examples: 200
download_size: 1337773
dataset_size: 1420945
- config_name: chemistry
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1239598
num_examples: 200
download_size: 1155926
dataset_size: 1239598
- config_name: computer science
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1231345
num_examples: 200
download_size: 1167147
dataset_size: 1231345
- config_name: engineering
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1426990
num_examples: 200
download_size: 1326862
dataset_size: 1426990
- config_name: health
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1473394
num_examples: 200
download_size: 1383372
dataset_size: 1473394
- config_name: math
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1052974
num_examples: 200
download_size: 983395
dataset_size: 1052974
- config_name: physics
features:
- name: data
list:
- name: content
dtype: string
- name: role
dtype: string
- name: raw_response
struct:
- name: text
dtype: string
- name: raw_text
dtype: string
- name: knowledge_pieces
list: string
- name: doc_id
dtype: int64
- name: native_id
dtype: int64
splits:
- name: train
num_bytes: 1196930
num_examples: 200
download_size: 1118169
dataset_size: 1196930
configs:
- config_name: biology
data_files:
- split: train
path: biology/train-*
- config_name: chemistry
data_files:
- split: train
path: chemistry/train-*
- config_name: computer science
data_files:
- split: train
path: computer science/train-*
- config_name: engineering
data_files:
- split: train
path: engineering/train-*
- config_name: health
data_files:
- split: train
path: health/train-*
- config_name: math
data_files:
- split: train
path: math/train-*
- config_name: physics
data_files:
- split: train
path: physics/train-*
---
数据集信息:
- 配置名称:生物学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1420945
样本数量:200
下载大小:1337773
数据集存储大小:1420945
- 配置名称:化学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1239598
样本数量:200
下载大小:1155926
数据集存储大小:1239598
- 配置名称:计算机科学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1231345
样本数量:200
下载大小:1167147
数据集存储大小:1231345
- 配置名称:工程学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1426990
样本数量:200
下载大小:1326862
数据集存储大小:1426990
- 配置名称:健康科学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1473394
样本数量:200
下载大小:1383372
数据集存储大小:1473394
- 配置名称:数学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1052974
样本数量:200
下载大小:983395
数据集存储大小:1052974
- 配置名称:物理学
特征:
- 字段名称:data,列表类型,包含:
- 子字段:content,数据类型:字符串(string)
- 子字段:role,数据类型:字符串(string)
- 字段名称:raw_response,结构体类型,包含:
- 子字段:text,数据类型:字符串(string)
- 字段名称:raw_text,数据类型:字符串(string)
- 字段名称:knowledge_pieces,列表类型,元素数据类型为字符串(string)
- 字段名称:doc_id,数据类型:64位整数(int64)
- 字段名称:native_id,数据类型:64位整数(int64)
数据集划分:
- 划分名称:训练集(train)
字节数:1196930
样本数量:200
下载大小:1118169
数据集存储大小:1196930
配置项:
- 配置名称:生物学
数据文件:
- 划分:训练集(train)
文件路径:biology/train-*
- 配置名称:化学
数据文件:
- 划分:训练集(train)
文件路径:chemistry/train-*
- 配置名称:计算机科学
数据文件:
- 划分:训练集(train)
文件路径:computer science/train-*
- 配置名称:工程学
数据文件:
- 划分:训练集(train)
文件路径:engineering/train-*
- 配置名称:健康科学
数据文件:
- 划分:训练集(train)
文件路径:health/train-*
- 配置名称:数学
数据文件:
- 划分:训练集(train)
文件路径:math/train-*
- 配置名称:物理学
数据文件:
- 划分:训练集(train)
文件路径:physics/train-*
提供机构:
lihaoxin2020



