TERRA-REF
收藏github2022-08-16 更新2024-05-31 收录
下载链接:
https://github.com/genophenoenvo/terraref-datasets
下载链接
链接失效反馈官方服务:
资源简介:
TERRA-REF是一个开放参考数据集,来自高分辨率基因组学、表型学和成像传感器的数据,版本6,包含多个季节和地点的植物性状数据及相关的天气数据。
TERRA-REF is an open reference dataset derived from high-resolution genomics, phenomics, and imaging sensors. Version 6 encompasses plant trait data and associated weather data across multiple seasons and locations.
创建时间:
2019-08-23
原始信息汇总
数据集概述
数据集名称
- TERRA-REF and related data for GenoPhenoEnvo research project
数据集内容
- 包含四个实验地点的_Sorghum bicolor_性状数据及相应天气数据。
实验地点及数据
-
Maricopa Agricultural Center, University of Arizona, Season 4
- 坐标: 33.069, -111.972
- 海拔: 362米
- 种植日期: 2017-04-20, 第110天
- 收获最后日期: 2017-09-16, 第259天
- 性状数据文件:
mac_season_4_aboveground_dry_biomass.csvmac_season_4_canopy_height_manual.csvmac_season_4_days_gdd_to_flowering.csvmac_season_4_days_gdd_to_flag_leaf_emergence.csv
-
Maricopa Agricultural Center, University of Arizona, Season 6
- 坐标: 33.068941, -111.972244
- 海拔: 362米
- 种植日期: 2018-04-25, 第115天
- 收获日期: 2018-08-01, 第213天
- 性状数据文件:
mac_season_6_aboveground_dry_biomass.csvmac_season_6_canopy_height_sensor.csv
-
Kansas State University, Ashland Bottoms
- 坐标: 39.126, -96.677
- 海拔: 325米
- 种植日期: 2016-06-17, 第169天
- 收获日期: 2016-10-21, 第295天
- 性状数据文件:
ksu_canopy_heights.csvksu_days_gdd_to_flowering.csv
-
Clemson University Pee Dee Research and Education Center, South Carolina
- 坐标: 34.289, -79.737
- 海拔: 42米
- 种植日期: 2014-05-06, 第126天
- 最新数据日期: 2014-10-15, 第288天
- 性状数据文件:
clemson_days_gdd_to_flowering.csvclemson_plant_height.csvclemson_aboveground_dry_biomass.csv
性状数据处理
- 性状包括:
days_to_flowering: 天数, 生长度日days_to_flag_leaf_emergence: 天数, 生长度日canopy_height: 厘米aboveground_dry_biomass: 公斤/公顷
天气数据
- 包含日期、温度、相对湿度、蒸气压差、降水量等参数。
- 数据处理代码位于
src/weather_data_cleaning.py,输出文件包括:mac_season_4_weather.csvmac_season_6_weather.csvksu_weather.csvclemson_weather.csv
数据使用与许可
- TERRA-REF Season 4和6数据遵循CC-0许可,引用LeBauer et al 2020。
- KSU数据未发表,未经Geoff Morris许可不得重用。
- Clemson数据引用自Brenton et al (2016)。
- 本仓库遵循MIT许可。
搜集汇总
数据集介绍

构建方式
TERRA-REF数据集是通过在多个实验地点对高粱(Sorghum bicolor)进行表型数据采集和天气数据记录构建而成。数据主要来源于亚利桑那大学马里科帕农业中心、堪萨斯州立大学和克莱姆森大学的研究实验。每个实验地点的数据包括种植日期、收获日期、地理位置、海拔高度等详细信息。数据采集过程中,使用了高分辨率的基因组学、表型学和成像传感器技术,确保数据的精确性和全面性。所有数据均遵循FAIR原则,旨在推动开放科学的发展。
特点
TERRA-REF数据集的特点在于其多维度的数据覆盖,涵盖了高粱的生长周期、表型特征以及环境因素。数据集包括地上生物量、冠层高度、开花天数等表型数据,以及温度、湿度、降水量等天气数据。这些数据不仅具有高时间分辨率,还通过累积生长度日(GDD)等指标,提供了对植物生长环境的深入理解。此外,数据集还包含了不同实验地点的水处理信息,为研究干旱对作物生长的影响提供了宝贵资源。
使用方法
TERRA-REF数据集的使用方法较为灵活,用户可以通过CyVerse平台下载以CSV格式存储的表型数据和天气数据。数据集还提供了多个Jupyter Notebook,用于数据清洗和处理,帮助用户快速上手。天气数据的处理脚本位于`src/weather_data_cleaning.py`中,用户可以根据需要调整参数或扩展功能。此外,数据集的使用需遵循相应的许可协议,如CC-0和MIT许可,确保数据的合法使用和共享。
背景与挑战
背景概述
TERRA-REF数据集是由亚利桑那大学的David LeBauer等人于2020年发布的一个开放参考数据集,旨在支持高分辨率基因组学、表型组学和成像传感器的研究。该数据集主要聚焦于高粱(Sorghum bicolor)的表型数据,涵盖了多个实验地点的环境数据,包括亚利桑那大学马里科帕农业中心、堪萨斯州立大学和克莱姆森大学的研究数据。TERRA-REF数据集的发布为植物表型组学和基因组学研究提供了重要的数据支持,推动了开放科学和FAIR数据原则的实施。该数据集不仅为研究人员提供了丰富的高粱表型数据,还为机器学习研究提供了可重复的代码和数据访问工具。
当前挑战
TERRA-REF数据集在解决植物表型组学和基因组学领域的挑战时,面临多个关键问题。首先,数据集的构建需要整合来自不同实验地点和传感器的多源数据,数据格式和标准的统一成为一大挑战。其次,由于表型数据的采集依赖于复杂的传感器网络和人工测量,数据质量和一致性难以保证。此外,天气数据的获取和处理也面临挑战,尤其是在不同实验地点的气象数据来源和格式不一致的情况下。最后,数据集的开放性和可重复性要求研究人员在数据处理和共享过程中遵循严格的FAIR原则,这对数据管理和文档化提出了更高的要求。
常用场景
经典使用场景
TERRA-REF数据集在植物基因组学、表型组学和环境传感技术研究中具有广泛的应用。该数据集通过高分辨率的传感器数据,记录了高粱(Sorghum bicolor)在不同生长阶段的表型特征和环境条件,为研究人员提供了丰富的多维度数据。经典的使用场景包括利用这些数据进行植物生长模型的构建、环境对作物生长的影响分析,以及基于机器学习的表型预测研究。
衍生相关工作
基于TERRA-REF数据集,许多经典研究工作得以展开。例如,LeBauer等人(2020)利用该数据集开发了高通量表型分析工具,推动了植物表型组学的发展。此外,Brenton等人(2016)的研究展示了如何利用基因组数据改进高粱的生物能源特性。这些工作不仅深化了对作物生长机制的理解,还为农业技术的创新提供了重要参考。
数据集最近研究
最新研究方向
近年来,TERRA-REF数据集在植物基因组学、表型组学和环境传感技术领域的研究中扮演了重要角色。该数据集通过整合高分辨率的基因组、表型和环境传感器数据,为研究者提供了丰富的资源,特别是在高粱(Sorghum bicolor)的性状与环境互作研究中。当前的研究热点集中在利用机器学习技术对大规模表型数据进行自动化分析,以揭示作物生长与环境因素之间的复杂关系。TERRA-REF数据集的应用不仅推动了作物育种和精准农业的发展,还为应对气候变化下的粮食安全问题提供了科学依据。通过遵循FAIR数据原则,该数据集进一步促进了开放科学的发展,为全球研究者提供了可重复和透明的数据支持。
以上内容由遇见数据集搜集并总结生成



