hi-zero/pubmed_QA_embedding
收藏Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/hi-zero/pubmed_QA_embedding
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个基于PubMed的问答数据集,主要用于文本生成和问答任务。数据集包含多个特征,如问题、上下文、长答案、最终决策等,并且还包含了通过SentenceTransformer生成的嵌入向量。数据集仅包含测试集,且数据来源于qiaojin/PubMedQA数据集中的pqa_artificial子集。
该数据集是一个基于PubMed的问答数据集,主要用于文本生成和问答任务。数据集包含多个特征,如问题、上下文、长答案、最终决策等,并且还包含了通过SentenceTransformer生成的嵌入向量。数据集仅包含测试集,且数据来源于qiaojin/PubMedQA数据集中的pqa_artificial子集。
提供机构:
hi-zero
原始信息汇总
数据集概述
数据集名称
- 名称: Pubmed Question and Answering dataset (embedding version)(only test set)
数据集特征
- pubid: 整数类型 (int32)
- question: 字符串类型 (string)
- context:
- contexts: 字符串类型 (string)
- labels: 字符串类型 (string)
- meshes: 字符串类型 (string)
- reasoning_required_pred: 字符串类型 (string)
- reasoning_free_pred: 字符串类型 (string)
- long_answer: 字符串类型 (string)
- final_decision: 字符串类型 (string)
- embeddings: 浮点数序列类型 (float32)
数据集划分
- train:
- num_examples: 1000
- num_bytes: 6188898
数据集大小
- download_size: 5796482
- dataset_size: 6188898
任务类别
- text-generation
- question-answering
语言
- en
许可证
- MIT



