five

FishGlob数据库

收藏
github2024-05-20 更新2024-05-31 收录
下载链接:
https://github.com/AquaAuma/FishGlob_data
下载链接
链接失效反馈
官方服务:
资源简介:
FishGlob数据库是一个整合了科学底拖网调查中采集的鱼类生物多样性数据的数据库,详细描述了数据处理和清洁的方法,以及如何使用这些数据。

The FishGlob database is a comprehensive repository that integrates fish biodiversity data collected from scientific bottom trawl surveys. It provides detailed descriptions of data processing and cleaning methodologies, as well as guidelines on how to utilize this data effectively.
创建时间:
2022-12-20
原始信息汇总

数据集概述

名称: FishGlob_data

描述: 该数据集包含FishGlob数据库,用于加载、清洗和处理公共底拖网调查数据。数据库详细描述于论文"An integrated database of fish biodiversity sampled with scientific bottom trawl surveys"。

作者: Aurore A. Maureaud, Juliano Palacios-Abrantes, Zoë Kitchel, Laura Mannocci, Malin L. Pinsky, Alexa Fredston, Esther Beukhof, Daniel L. Forrest, Romain Frelat, Maria L.D. Palomares, Laurene Pecuchet, James T. Thorson, P. Daniël van Denderen, Bastien Mérigot

许可证: Creative Commons Attribution 4.0 International License

数据集结构

  • cleaning_codes: 包含处理和执行质量控制的脚本。
  • data_descriptor_figures: 包含构建数据描述手稿中图2-4的R脚本。
  • functions: 包含在其他脚本中使用的实用函数。
  • length_weight: 包含需要从长度数据计算重量的调查的长度-重量关系。
  • metadata_docs: 包含每个调查的README文件,记录调查方法的变化、特点等。
  • outputs: 包含所有处理过的调查数据.RData文件和标记输出。
  • QAQC: 包含对需要额外检查的调查执行的额外质量保证/质量控制。
  • standard_formats: 包含FishGlob数据库中文件格式的定义,包括调查ID代码。
  • standardization_steps: 包含运行完整调查标准化和跨调查标记方法摘要的R代码。
  • summary: 包含每个调查的质量检查图。

数据处理步骤

  1. 合并一个调查的数据文件。
  2. 清洁并统一列名,遵循standard_formats/fishglob_data_columns.xlsx中描述的格式。
  3. 创建缺失列并使用标准格式standard_formats/fishglob_data_columns.xlsx标准化单位。
  4. 通过应用*clean_taxa()*函数并应用专家知识进行分类处理,集成清洁的分类学。
  5. 执行质量检查,包括summary文件夹中的输出和QAQC文件夹中详细的其他调查的特定QAQC。

数据标准化和标记

  1. 分类质量控制:为每个调查区域运行flag_spp()。
  2. 应用方法确定每个调查季节/季度的标准空间足迹(调查_单位列)。使用函数apply_trimming_per_survey_unit_method1()和apply_trimming_per_survey_unit_method2()。
  3. 在摘要文件中显示和集成结果。

最终数据产品

用户可以选择使用outputs/Cleaned_data/中的单个调查数据产品,并使用包含标记的调查.RData文件,或者通过运行cleaning_codes/merge.R生成自己的数据编译版本,该版本将本地数据库写入outputs/Compiled_data/

作者贡献

  • 清洁分类学: Juliano Palacios-Abrantes
  • 清洁调查: Juliano Palacios-Abrantes, Aurore Maureaud, Zoë Kitchel, Dan Forrest, Daniël van Denderen, Laurene Pecuchet, Esther Beukhof
  • 调查摘要: Juliano Palacios-Abrantes, Aurore Maureaud, Zoë Kitchel, Laura Mannocci
  • 合并调查: Aurore Maureaud
  • 标准化调查: Laura Mannocci, Malin Pinsky, Aurore Maureaud, Zoë Kitchel, Alexa Fredston
  • DATRAS调查的QAQC: Aurore Maureaud, Daniël van Denderen, Esther Beukhof, Laurene Pecuchet
  • 巴伦支海调查的QAQC: Laurene Pecuchet
  • 北美调查的QAQC: Zoë Kitchel, Malin Pinsky, Daniel Forrest

重要更新

  • 5/06/2024: 不推荐将FishGlob数据保存为.csv格式,建议使用.Rdata或.rds格式。
  • 23/11/2023: FishGlob_data v2.0发布。
  • 05/09/2023: 挪威调查数据有误,将被2004年以后的巴伦支海调查数据替换。
搜集汇总
数据集介绍
main_image_url
构建方式
FishGlob数据库的构建基于全球范围内的科学底拖网调查数据,通过一系列精细的处理步骤实现。首先,数据文件按调查进行合并,随后依据标准格式对列名进行清理和统一。接着,创建缺失列并标准化单位,同时通过应用*clean_taxa()*函数和专家知识对分类学进行清理。最后,执行质量检查,包括生成总结文件和针对特定调查的额外质量保证与质量控制(QAQC)。
特点
FishGlob数据库的显著特点在于其全球性和标准化处理。该数据库涵盖了29个科学底拖网调查,确保了数据的广泛覆盖和一致性。此外,数据库中的数据经过严格的分类学清理和质量控制,确保了数据的准确性和可靠性。用户可以选择使用单个调查的数据产品,或通过运行合并脚本生成自定义的数据库版本。
使用方法
FishGlob数据库的使用方法灵活多样。用户可以直接使用**outputs/Cleaned_data/**目录下的单个调查数据产品,这些产品包括带有或不带有标志的.RData文件。此外,用户还可以通过运行**cleaning_codes/merge.R**脚本,生成自定义的合并数据库版本,存储在**outputs/Compiled_data/**目录下。为避免数据格式转换错误,建议使用.RData或.rds格式进行数据读写。
背景与挑战
背景概述
FishGlob数据库是由CESAB工作组开发的综合性鱼类生物多样性数据库,旨在通过科学底拖网调查评估全球鱼类生物多样性。该数据库由Aurore A. Maureaud、Juliano Palacios-Abrantes等研究人员于近年创建,主要用于整合和标准化全球范围内的底拖网调查数据。FishGlob数据库的核心研究问题是如何在全球变化背景下,系统性地整合和分析来自不同区域的鱼类生物多样性数据,以支持生态学和渔业科学的研究。该数据库的创建不仅提升了数据的可比性和可用性,还为全球鱼类生物多样性保护和渔业管理提供了重要的科学依据。
当前挑战
FishGlob数据库在构建过程中面临多项挑战。首先,数据来源多样且格式不统一,导致数据整合和标准化过程复杂。其次,不同调查区域的方法和标准差异显著,需进行详细的质控和校正。此外,鱼类分类学的复杂性要求对物种名称和分类进行严格的清理和标准化。最后,数据的时间和空间覆盖范围广泛,需确保数据在不同区域和时间段的一致性和准确性。这些挑战共同构成了FishGlob数据库开发和维护的主要难点,同时也为未来的数据处理和分析提出了更高的要求。
常用场景
经典使用场景
FishGlob数据库的经典使用场景主要集中在海洋生态学和渔业科学领域,尤其是通过科学底拖网调查数据进行鱼类生物多样性的全球评估。研究者可以利用该数据库进行跨区域、跨时间的鱼类种群动态分析,评估气候变化对鱼类分布和丰度的影响,以及探索渔业资源的管理策略。
实际应用
FishGlob数据库在实际应用中广泛用于渔业管理和政策制定。例如,渔业管理者可以利用该数据库评估特定区域的鱼类资源状况,制定捕捞限额和保护措施。此外,该数据库还可用于监测海洋生态系统的健康状况,为全球海洋保护提供科学依据。
衍生相关工作
FishGlob数据库的发布催生了一系列相关研究工作,包括基于该数据库的全球鱼类生物多样性评估、气候变化对鱼类分布的影响研究,以及渔业资源管理的优化策略。这些研究不仅丰富了海洋生态学和渔业科学的理论基础,还为实际应用提供了重要支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作