GEO (Gene Expression Omnibus)|基因组学数据集|数据存储数据集
收藏
- GEO (Gene Expression Omnibus) 由美国国立卫生研究院 (NIH) 的国家生物技术信息中心 (NCBI) 首次发布,旨在为基因表达数据提供一个公共存储和分析平台。
- GEO 开始接受来自全球研究人员的基因表达数据提交,标志着其作为公共数据库的正式启动。
- GEO 引入了 GEO Profiles 功能,允许用户创建和共享自定义的基因表达数据集,增强了数据的可访问性和互操作性。
- GEO 发布了 GEO Datasets (GDS),这是一个经过预处理的基因表达数据集集合,便于研究人员进行快速数据分析和比较。
- GEO 推出了 GEO2R,一个基于网页的工具,允许用户在线进行基因表达数据的实时分析和比较。
- GEO 开始支持高通量测序数据的提交和存储,标志着其从微阵列数据向新一代测序数据的扩展。
- GEO 引入了 GEO DataSets (GSE) 的批量下载功能,极大地提高了数据获取的效率。
- GEO 发布了 GEO DataSets (GSE) 的 API,使得开发者能够更方便地集成和利用 GEO 的数据资源。
- GEO 继续扩展其数据存储和分析功能,支持更多类型的生物数据,包括单细胞测序数据。
Global Solar Dataset
在快速扩展的太阳能领域,找到全面的国家规模光伏(PV)数据集可能具有挑战性。资源通常分散在多个网站和API中,质量和可访问性差异显著。该仓库旨在通过将这些数据集的位置集中到一个位置来简化对这些数据集的访问,从而支持研究并促进新旧市场中太阳能预测模型的开发。
github 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
Desert Knowledge Australia Solar Centre PV Power Data
该数据集包含来自澳大利亚Alice Springs的Site 7的太阳能发电数据,包括有功功率(AP,kW)、历史温度(T,℃)、相对湿度(RH,%)、全球水平辐照度(GHI,Wh/m²)和漫射水平辐照度(DHI,Wh/m²)。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录