five

Big Bat Database|蝙蝠研究数据集|生物多样性保护数据集

收藏
github2024-11-10 更新2024-11-12 收录
蝙蝠研究
生物多样性保护
下载链接:
https://github.com/BigBatDB/bigbatdb
下载链接
链接失效反馈
资源简介:
将现有数据库中的蝙蝠特征(形态学、功能特征、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体、种群大小等)整合到一个大型全球数据库中,以支持多种项目,并利用该数据库回答关于多样化、灭绝、保护、疾病动态、特征进化等问题。
创建时间:
2024-10-24
原始信息汇总

Big Bat Database

描述

将现有的数据库整合为一个大型全球数据库,涵盖特征(形态学、功能特征、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体、种群规模等),以支持多种项目,并利用该数据库回答关于多样化驱动因素、灭绝、保护、疾病动态、特征进化等问题。

目标

  • 设定多个物种的特征数量。
  • 尽可能收集数据,识别数据缺口并制定数据收集指南。
  • 在中央数据库中以某种结构完全记录数据。

历史

版本 记录数量 发布日期 指纹
v0.1 1 2024-10-23

v0.1

first record

出处

preston history --algo md5

urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://purl.org/pav/hasVersion hash://md5/36f6226d43a533da752dd80447a8fb1b .

preston ls --algo md5

https://preston.guoda.bio http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#SoftwareAgent urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://preston.guoda.bio http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Agent urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://preston.guoda.bio http://purl.org/dc/terms/description "Preston is a software program that finds, archives and provides access to biodiversity datasets."@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Activity urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://purl.org/dc/terms/description "BigBatDB v0.1"@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/ns/prov#startedAtTime "2024-10-23T23:42:30.494Z"^^http://www.w3.org/2001/XMLSchema#dateTime urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/ns/prov#wasStartedBy https://preston.guoda.bio urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://www.w3.org/ns/prov#usedBy urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://purl.org/dc/dcmitype/Software urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://purl.org/dc/terms/bibliographicCitation "Jorrit Poelen, Icaro Alzuru, & Michael Elliott. 2018-2024. Preston: a biodiversity dataset tracker (Version 0.9.9-SNAPSHOT) [Software]. Zenodo. https://doi.org/10.5281/zenodo.1410543"@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Entity urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://purl.org/dc/terms/description "A biodiversity dataset graph archive."@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e http://www.w3.org/ns/prov#wasGeneratedBy urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e http://www.w3.org/ns/prov#qualifiedGeneration urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#generatedAtTime "2024-10-23T23:42:30.611Z"^^http://www.w3.org/2001/XMLSchema#dateTime urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Generation urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#wasInformedBy urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#used urn:uuid:2fe7c292-09b7-4ed0-a8fe-31efec1aff40 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:2fe7c292-09b7-4ed0-a8fe-31efec1aff40 http://purl.org/pav/hasVersion hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 .

AI搜集汇总
数据集介绍
main_image_url
构建方式
Big Bat Database的构建方式体现了跨学科的综合性。该数据集通过整合现有的多个数据库,涵盖了从形态学、功能性状、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体到种群规模等多个维度的数据。这一过程不仅涉及数据的收集与整合,还包括对数据缺失部分的识别与补充,旨在为全球范围内的多种研究项目提供坚实的数据基础。
特点
Big Bat Database的显著特点在于其全面性和全球性。该数据集不仅涵盖了多种生物学特征,还跨越了多个物种,为研究者提供了丰富的数据资源。此外,数据集的构建过程中注重数据的完整性和结构化,确保每一项数据都有详细的文档记录,便于后续的分析与应用。这种全面性和结构化的特点使得该数据集在生物多样性研究、进化生物学、保护生物学等领域具有广泛的应用潜力。
使用方法
Big Bat Database的使用方法简便且灵活。研究者可以通过访问数据集的官方网站或GitHub页面,获取所需的数据文件。数据集提供了多种格式的数据下载选项,包括CSV、JSON等,便于不同研究工具的兼容与处理。此外,数据集还提供了详细的元数据信息,帮助用户理解数据的来源、处理过程及潜在的应用场景。研究者可以根据自身需求,选择合适的数据子集进行分析,从而在生物多样性、进化、保护等多个领域开展深入研究。
背景与挑战
背景概述
Big Bat Database(大蝙蝠数据库)是由Jorrit Poelen等人于2024年创建的,旨在整合全球现有的蝙蝠特征数据库,包括形态学、功能特征、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体、种群规模等多个方面。该数据库的核心研究问题涉及多样化的驱动因素、灭绝、保护、疾病动态、特征进化等,旨在为多个跨学科项目提供基础数据支持,对蝙蝠生态学和保护生物学领域具有重要影响。
当前挑战
Big Bat Database在构建过程中面临多项挑战。首先,整合来自不同来源的数据,确保数据的一致性和准确性是一个复杂的过程。其次,数据收集的广泛性和多样性要求制定详细的数据收集指南,以填补现有数据的空白。此外,确保数据的完整性和结构化存储,以便于后续的分析和应用,也是该数据库面临的重要挑战。
常用场景
经典使用场景
在生态学和生物多样性研究领域,Big Bat Database 数据集的经典使用场景主要集中在蝙蝠物种的多样性分析和生态特征研究。该数据集整合了蝙蝠的形态学、功能性状、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体、种群规模等多维度数据,为科学家提供了全面的研究基础。通过这些数据,研究人员可以深入探讨蝙蝠物种的进化历程、生态适应性以及在全球环境变化背景下的生存策略。
解决学术问题
Big Bat Database 数据集在学术研究中解决了多个关键问题,特别是在蝙蝠物种的多样性、进化和保护生物学领域。该数据集通过整合多源数据,为研究者提供了丰富的信息资源,有助于揭示蝙蝠物种的进化驱动因素、灭绝风险评估以及疾病动态等复杂问题。此外,该数据集还为制定有效的保护策略提供了科学依据,对于全球生物多样性保护具有重要意义。
衍生相关工作
Big Bat Database 数据集的发布催生了多项相关研究工作,特别是在蝙蝠生态学和保护生物学领域。例如,基于该数据集的研究揭示了蝙蝠物种的多样性分布模式和进化历史,为全球生物多样性研究提供了新的视角。此外,该数据集还促进了蝙蝠疾病传播模型的开发,为公共卫生研究提供了重要数据支持。这些衍生工作不仅丰富了蝙蝠生态学的知识体系,也为相关领域的政策制定和实践应用提供了科学依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CatMeows

该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。

huggingface 收录

FMA (Free Music Archive)

免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集

OpenDataLab 收录

人民日报语料库

该数据集包含2023年5月至2024年4月期间人民日报的全部文章,以JSON格式保存,每篇文章包含URL、标题和内容。

github 收录

TPTP

TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。

www.tptp.org 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录