Muhammad2003/OpenMed_11k
收藏Hugging Face2024-04-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Muhammad2003/OpenMed_11k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: data
struct:
- name: Context
sequence: string
- name: Correct Answer
dtype: string
- name: Correct Option
dtype: string
- name: Long Answer
dtype: string
- name: Options
struct:
- name: A
dtype: string
- name: B
dtype: string
- name: C
dtype: string
- name: D
dtype: string
- name: Question
dtype: string
- name: subject_name
dtype: string
splits:
- name: train
num_bytes: 10976131
num_examples: 11717
download_size: 6491888
dataset_size: 10976131
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:id,数据类型:字符串(string)
- 字段名:data,为结构体类型,包含以下子字段:
- 上下文(Context):字符串序列
- 标准答案:字符串(string)
- 正确选项:字符串(string)
- 详细解析:字符串(string)
- 选项:结构体类型,包含子选项A、B、C、D,各数据类型均为字符串(string)
- 问题:字符串(string)
- 学科名称(subject_name):字符串(string)
数据集划分:
- 划分名称:训练集(train),占用字节数:10976131,样本总量:11717
下载总大小:6491888
数据集总大小:10976131
配置项:
- 配置名称:默认(default),数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
Muhammad2003
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- data: 结构化数据,包含以下字段:
- Context: 数据类型为字符串。
- Correct Answer: 数据类型为字符串。
- Correct Option: 数据类型为字符串。
- Long Answer: 数据类型为字符串。
- Options: 结构化数据,包含以下字段:
- A: 数据类型为字符串。
- B: 数据类型为字符串。
- C: 数据类型为字符串。
- D: 数据类型为字符串。
- Question: 数据类型为字符串。
- subject_name: 数据类型为字符串。
数据集分割
- train:
- 数据大小: 10976131 字节
- 示例数量: 11717
数据集大小
- 下载大小: 6491888 字节
- 数据集总大小: 10976131 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



