M3SCIQA|科学问答数据集|多模态数据数据集
收藏M3SciQA 数据集概述
简介
M3SciQA 是一个多模态、多文档的科学问答基准数据集,旨在更全面地评估基础模型。该数据集包含 1,452 个专家注释的问题,涵盖 70 个自然语言处理(NLP)论文集群。每个集群代表一篇主要论文及其所有引用的文档,模拟了通过多模态和多文档数据理解单篇论文的工作流程。
数据集结构
-
数据文件夹 (
data/
):locality.jsonl
: 包含特定位置的问题。combined_test.jsonl
: 包含组合的测试问题。combined_val.jsonl
: 包含组合的验证问题。locality/
: 包含用于构成特定位置问题的所有图像。
-
结果文件夹 (
results/
):- 包含不同设置下的评估结果。
-
源代码文件夹 (
src/
):data_utils.py
: 数据处理工具。evaluate_detail.py
: 用于评估细节特定问题的响应。evaluate_locality.py
: 用于评估位置特定问题的响应。generate_detail.py
: 用于生成细节特定问题的响应。generate_locality.py
: 用于生成位置特定问题的响应。models_w_vision.py
: 包含视觉模型的代码。models_wo_vision.py
: 不包含视觉模型的代码。
位置特定问题评估
输出格式
json { "question_anchor": "...", "reference_arxiv_id": "...", "reference_s2_id": "...", "response": "..." }
response
字段包含模型的输出排名。
响应生成
例如,评估 GPT-4o 的命令: bash cd src python generate_locality.py --model gpt_4_o
响应评估
例如,计算 GPT-4o 的 MRR、NDCG@3 和 Recall@3 的命令:
bash
python evaluate_locality.py
--result_path ../results/locality_response/gpt_4_o.jsonl
--k 3
细节特定问题评估
输出格式
json { "question": "...", "answer": "...", "response": "...", "reference_reasoning_type": "..." }
响应生成
例如,使用 GPT-4 生成响应的命令: bash cd src python generate_detail.py --model gpt_4 --k 3 --chunk_length 15000
响应评估
例如,评估 GPT-4 生成响应的命令: bash python evaluate_detail.py --result_path ../results/retrieval@3/gpt_4.jsonl

- 1M3SciQA: A Multi-Modal Multi-Document Scientific QA Benchmark for Evaluating Foundation Models耶鲁大学 · 2024年
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录