five

davidgaofc/MedQuad_split

收藏
Hugging Face2023-11-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/davidgaofc/MedQuad_split
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: features: - name: qtype dtype: string - name: Question dtype: string - name: Answer dtype: string splits: - name: SFT_train1 num_bytes: 7902949.746571586 num_examples: 5742 - name: SFT_train2 num_bytes: 7902949.746571586 num_examples: 5742 - name: test num_bytes: 2257199.1613335772 num_examples: 1640 - name: RL num_bytes: 2257199.1613335772 num_examples: 1640 - name: RM_oos num_bytes: 1128599.5806667886 num_examples: 820 - name: Shadow_oos num_bytes: 1128599.5806667886 num_examples: 820 download_size: 10355013 dataset_size: 22577496.9771439 configs: - config_name: default data_files: - split: SFT_train1 path: data/SFT_train1-* - split: SFT_train2 path: data/SFT_train2-* - split: test path: data/test-* - split: RL path: data/RL-* - split: RM_oos path: data/RM_oos-* - split: Shadow_oos path: data/Shadow_oos-* --- A Question-Entailment Approach to Question Answering". Asma Ben Abacha and Dina Demner-Fushman. BMC Bioinformatics, 2019.

许可证:MIT 数据集信息: 数据集特征: - 特征字段名:qtype,数据类型:字符串 - 特征字段名:Question,数据类型:字符串 - 特征字段名:Answer,数据类型:字符串 数据拆分: - 名称:SFT_train1,字节数:7902949.746571586,样本数:5742 - 名称:SFT_train2,字节数:7902949.746571586,样本数:5742 - 名称:test,字节数:2257199.1613335772,样本数:1640 - 名称:RL,字节数:2257199.1613335772,样本数:1640 - 名称:RM_oos,字节数:1128599.5806667886,样本数:820 - 名称:Shadow_oos,字节数:1128599.5806667886,样本数:820 下载大小:10355013 数据集总大小:22577496.9771439 配置项: - 配置名称:default 数据文件: - 拆分:SFT_train1,路径:data/SFT_train1-* - 拆分:SFT_train2,路径:data/SFT_train2-* - 拆分:test,路径:data/test-* - 拆分:RL,路径:data/RL-* - 拆分:RM_oos,路径:data/RM_oos-* - 拆分:Shadow_oos,路径:data/Shadow_oos-* 文献引用:《面向问答的问题蕴含方法》(A Question-Entailment Approach to Question Answering),作者阿斯玛·本·阿巴查(Asma Ben Abacha)与迪娜·德姆纳-富什曼(Dina Demner-Fushman),发表于《BMC生物信息学》(BMC Bioinformatics),2019年。
提供机构:
davidgaofc
原始信息汇总

数据集概述

特征信息

  • qtype: 字符串类型
  • Question: 字符串类型
  • Answer: 字符串类型

数据分割

  • SFT_train1:
    • 字节数: 7902949.746571586
    • 样本数: 5742
  • SFT_train2:
    • 字节数: 7902949.746571586
    • 样本数: 5742
  • test:
    • 字节数: 2257199.1613335772
    • 样本数: 1640
  • RL:
    • 字节数: 2257199.1613335772
    • 样本数: 1640
  • RM_oos:
    • 字节数: 1128599.5806667886
    • 样本数: 820
  • Shadow_oos:
    • 字节数: 1128599.5806667886
    • 样本数: 820

数据大小

  • 下载大小: 10355013 字节
  • 数据集大小: 22577496.9771439 字节

配置信息

  • default 配置:
    • SFT_train1: data/SFT_train1-*
    • SFT_train2: data/SFT_train2-*
    • test: data/test-*
    • RL: data/RL-*
    • RM_oos: data/RM_oos-*
    • Shadow_oos: data/Shadow_oos-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作