five

taesiri/arxiv_qa

收藏
Hugging Face2024-04-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/taesiri/arxiv_qa
下载链接
链接失效反馈
官方服务:
资源简介:
ArXiv QA数据集是一个基于ArXiv论文的自动问答数据集,包含与ArXiv论文相关的问题和答案。数据集的特征包括论文ID(paper_id)、模型(model)、问题(question)和答案(answer)。该数据集可能用于训练和评估大型语言模型在ArXiv论文上的问答能力。
提供机构:
taesiri
原始信息汇总

数据集概述

数据集名称

  • ArXiv QA

语言

  • 英语(en)

许可证

  • CC-BY-4.0

任务类别

  • 问答(question-answering)

配置

  • 默认配置
    • 数据文件路径:data/train-*

数据集信息

  • 特征

    • paper_id:字符串类型
    • model:字符串类型
    • question:字符串类型
    • answer:字符串类型
  • 分割

    • train
      • 字节数:313044231
      • 示例数:210580
  • 下载大小

    • 128601870字节
  • 数据集大小

    • 313044231字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作