SciQ|科学教育数据集|考试评估数据集
收藏数据集概述
数据集名称
- SciQ
数据集内容
- 包含13,679个众包科学考试问题,涉及物理学、化学和生物学等多个科学领域。
数据集来源
- 可从Kaggle或Huggingface下载。
数据集用途
- 用于训练
flan-t5-base
模型,以回答科学相关问题。
模型训练
训练环境
- 使用
Nvidia Tesla T4
GPU,具有16GB
VRAM,在Google Colab Free Tier
上进行训练。
训练参数
batch size
: 初始为8,后调整为32learning rate
: 3e-4epochs
: 初始为3,后调整为1
训练结果
training loss
: 1.3092validation loss
: 0.9788ROUGE-1
: 0.4977ROUGE-2
: 0.1207ROUGE-L
: 0.4972ROUGE LSUM
: 0.4968
模型部署
- 经过微调的模型
flan-t5-base-sciq
已上传至Huggingface模型库,可从此处访问。

中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
China Kadoorie Biobank (CKB)
China Kadoorie Biobank(CKB)是一项大规模的前瞻性队列研究数据库,旨在通过长期跟踪调查收集中国人群的健康相关信息,包括生活方式、环境暴露、生物样本以及疾病发生发展情况,为慢性病的病因研究和防控策略制定提供科学依据。
www.ckbiobank.org 收录