The Sol Genomics Network|基因组学数据集|茄科植物数据集
收藏
- The Sol Genomics Network (SGN) 首次发表,标志着番茄基因组学研究的重要开端。
- SGN 首次应用于番茄基因组测序项目,为后续的基因组学研究奠定了基础。
- SGN 扩展至包括其他茄科植物,如马铃薯和辣椒,进一步丰富了数据集的内容。
- SGN 引入了新的数据分析工具和可视化平台,提升了数据处理和研究效率。
- SGN 与国际番茄基因组联盟合作,发布了首个完整的番茄基因组序列,标志着数据集的重要里程碑。
- SGN 继续扩展其数据库,涵盖了更多的茄科植物基因组信息,并持续更新和优化其平台功能。
- 1The Sol Genomics Network: A Comparative Resource for Solanaceae Biology and BeyondUniversity of Georgia · 2011年
- 2Genomic and transcriptomic insights into the evolution and domestication of tomatoCold Spring Harbor Laboratory · 2020年
- 3Genomic insights into the origin and diversification of the SolanaceaeUniversity of California, Davis · 2019年
- 4The Solanaceae Genomics Network: A Resource for Plant BiologyUniversity of Georgia · 2015年
- 5Genomic resources for the Solanaceae: current status and future directionsUniversity of California, Davis · 2018年
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
VQA
我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。
OpenDataLab 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录