Supporting data for "Computational reproducibility of Jupyter notebooks from biomedical publications"|生物医学数据集|计算可重复性数据集
收藏ERIC (Education Resources Information Center)
ERIC (Education Resources Information Center) 是一个广泛的教育文献数据库,包含超过130万条记录,涵盖从1966年至今的教育研究、政策和实践。数据集内容包括教育相关的期刊文章、书籍、研究报告、会议论文、技术报告、政策文件等。
eric.ed.gov 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
Allen Brain Atlas
Allen Brain Atlas 是一个综合性的脑图谱数据库,提供了详细的大脑解剖结构、基因表达数据、神经元连接信息等。该数据集包括了小鼠、人类和其他模式生物的大脑数据,旨在帮助研究人员理解大脑的结构和功能。
portal.brain-map.org 收录
SeaDronesSee
SeaDronesSee是由德国图宾根大学认知系统组创建的大型视觉对象检测和跟踪基准,专注于海洋环境中的人类检测。该数据集包含超过54,000帧,总计400,000个实例,从不同高度和视角(5至260米,0至90度)捕获,并提供详细的元信息。数据集的创建旨在填补陆基视觉系统与海基系统之间的差距,特别适用于无人机辅助的海上搜救任务。SeaDronesSee通过提供精确的元数据,如高度、视角和速度,支持多模态系统的开发,以提高检测的准确性和速度。此外,数据集还包括多光谱图像,利用非可见光谱(如近红外和红边光谱)来增强人类检测能力。
arXiv 收录
