five

HongyiPeng/PubMedQA

收藏
Hugging Face2024-05-31 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HongyiPeng/PubMedQA
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - en dataset_info: features: - name: pubid dtype: int32 - name: question dtype: string - name: context struct: - name: contexts sequence: string - name: labels sequence: string - name: meshes sequence: string - name: reasoning_free_pred dtype: string - name: reasoning_required_pred dtype: string - name: long_answer dtype: string - name: final_decision dtype: string splits: - name: pqa_labeled num_bytes: 2065914 num_examples: 1000 - name: pqa_artificial num_bytes: 446881361 num_examples: 211269 download_size: 234604945 dataset_size: 448947275 configs: - config_name: default data_files: - split: pqa_labeled path: data/pqa_labeled-* - split: pqa_artificial path: data/pqa_artificial-* ---

语言: - 英语 数据集信息: 特征字段: - 字段名:pubid,数据类型:int32 - 字段名:question(问题),数据类型:字符串 - 字段名:context(上下文结构体),结构体包含: - 字段名:contexts,类型:字符串序列 - 字段名:labels,类型:字符串序列 - 字段名:meshes(医学主题词,MeSH),类型:字符串序列 - 字段名:reasoning_free_pred(无推理预测结果),数据类型:字符串 - 字段名:reasoning_required_pred(需推理预测结果),数据类型:字符串 - 字段名:long_answer(长答案),数据类型:字符串 - 字段名:final_decision(最终判定结果),数据类型:字符串 划分集: - 划分名称:pqa_labeled,字节数:2065914,样本数:1000 - 划分名称:pqa_artificial,字节数:446881361,样本数:211269 总下载大小:234604945 数据集总大小:448947275 配置项: - 配置名称:默认 数据文件: - 对应划分:pqa_labeled,文件路径:data/pqa_labeled-* - 对应划分:pqa_artificial,文件路径:data/pqa_artificial-*
提供机构:
HongyiPeng
原始信息汇总

数据集概述

数据集特征

  • pubid: 数据类型为 int32
  • question: 数据类型为 string
  • context: 结构化数据,包含以下子特征:
    • contexts: 数据类型为 sequence: string
    • labels: 数据类型为 sequence: string
    • meshes: 数据类型为 sequence: string
    • reasoning_free_pred: 数据类型为 string
    • reasoning_required_pred: 数据类型为 string
  • long_answer: 数据类型为 string
  • final_decision: 数据类型为 string

数据集分割

  • pqa_labeled:
    • 数据大小: 2065914 字节
    • 示例数量: 1000
  • pqa_artificial:
    • 数据大小: 446881361 字节
    • 示例数量: 211269

数据集大小

  • 下载大小: 234604945 字节
  • 数据集总大小: 448947275 字节

配置文件

  • default:
    • pqa_labeled: 文件路径为 data/pqa_labeled-*
    • pqa_artificial: 文件路径为 data/pqa_artificial-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作