taesiri/arxiv_qa
收藏Hugging Face2024-04-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/taesiri/arxiv_qa
下载链接
链接失效反馈官方服务:
资源简介:
ArXiv QA数据集是一个基于ArXiv论文的自动问答数据集,包含与ArXiv论文相关的问题和答案。数据集的特征包括论文ID(paper_id)、模型(model)、问题(question)和答案(answer)。该数据集可能用于训练和评估大型语言模型在ArXiv论文上的问答能力。
提供机构:
taesiri
原始信息汇总
数据集概述
数据集名称
- ArXiv QA
语言
- 英语(en)
许可证
- CC-BY-4.0
任务类别
- 问答(question-answering)
配置
- 默认配置
- 数据文件路径:
data/train-*
- 数据文件路径:
数据集信息
-
特征
paper_id:字符串类型model:字符串类型question:字符串类型answer:字符串类型
-
分割
train- 字节数:313044231
- 示例数:210580
-
下载大小
- 128601870字节
-
数据集大小
- 313044231字节



