Big Bat Database|蝙蝠研究数据集|生物多样性保护数据集
收藏Big Bat Database
描述
将现有的数据库整合为一个大型全球数据库,涵盖特征(形态学、功能特征、生活史特征、声学、行为、基因组学、栖息地需求、寄生虫、病原体、种群规模等),以支持多种项目,并利用该数据库回答关于多样化驱动因素、灭绝、保护、疾病动态、特征进化等问题。
目标
- 设定多个物种的特征数量。
- 尽可能收集数据,识别数据缺口并制定数据收集指南。
- 在中央数据库中以某种结构完全记录数据。
历史
版本 | 记录数量 | 发布日期 | 指纹 |
---|---|---|---|
v0.1 | 1 | 2024-10-23 |
v0.1
出处
preston history --algo md5
urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://purl.org/pav/hasVersion hash://md5/36f6226d43a533da752dd80447a8fb1b .
preston ls --algo md5
https://preston.guoda.bio http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#SoftwareAgent urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://preston.guoda.bio http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Agent urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://preston.guoda.bio http://purl.org/dc/terms/description "Preston is a software program that finds, archives and provides access to biodiversity datasets."@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Activity urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://purl.org/dc/terms/description "BigBatDB v0.1"@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/ns/prov#startedAtTime "2024-10-23T23:42:30.494Z"^^http://www.w3.org/2001/XMLSchema#dateTime urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 http://www.w3.org/ns/prov#wasStartedBy https://preston.guoda.bio urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://www.w3.org/ns/prov#usedBy urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://purl.org/dc/dcmitype/Software urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . https://doi.org/10.5281/zenodo.1410543 http://purl.org/dc/terms/bibliographicCitation "Jorrit Poelen, Icaro Alzuru, & Michael Elliott. 2018-2024. Preston: a biodiversity dataset tracker (Version 0.9.9-SNAPSHOT) [Software]. Zenodo. https://doi.org/10.5281/zenodo.1410543"@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Entity urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . urn:uuid:0659a54f-b713-4f86-a917-5be166a14110 http://purl.org/dc/terms/description "A biodiversity dataset graph archive."@en urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 . hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e http://www.w3.org/ns/prov#wasGeneratedBy urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e http://www.w3.org/ns/prov#qualifiedGeneration urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#generatedAtTime "2024-10-23T23:42:30.611Z"^^http://www.w3.org/2001/XMLSchema#dateTime urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/ns/prov#Generation urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#wasInformedBy urn:uuid:652771d8-a71e-4618-9bfd-dd53d1e90250 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 http://www.w3.org/ns/prov#used urn:uuid:2fe7c292-09b7-4ed0-a8fe-31efec1aff40 urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 . urn:uuid:2fe7c292-09b7-4ed0-a8fe-31efec1aff40 http://purl.org/pav/hasVersion hash://md5/2ccd2a31e9cc7492eb08f8da91268c8e urn:uuid:11665f3a-fc13-425f-841f-f705a3c905f3 .

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
FMA (Free Music Archive)
免费音乐档案 (FMA) 是一个大型数据集,用于评估音乐信息检索中的多个任务。它包含 343 天的音频,来自 16,341 位艺术家的 106,574 首曲目和 14,854 张专辑,按 161 种流派的分级分类排列。它提供完整长度和高质量的音频、预先计算的功能,以及轨道和用户级元数据、标签和自由格式的文本,例如传记。作者定义了四个子集:Full:完整数据集,Large:音频限制为 30 秒的完整数据集 从轨道中间提取的剪辑(如果短于 30 秒,则为整个轨道),Medium:选择25,000 个具有单一根流派的 30 年代剪辑,小:一个平衡的子集,包含 8,000 个 30 年代剪辑,其中 8 种根流派中的每一个都有 1,000 个剪辑。官方分为训练集、验证集和测试集(80/10/10)使用分层抽样来保留每个流派的曲目百分比。同一艺术家的歌曲只是一组的一部分。资料来源:FMA:音乐分析数据集
OpenDataLab 收录
人民日报语料库
该数据集包含2023年5月至2024年4月期间人民日报的全部文章,以JSON格式保存,每篇文章包含URL、标题和内容。
github 收录
TPTP
TPTP(Thousands of Problems for Theorem Provers)是一个包含大量逻辑问题的数据集,主要用于定理证明器的测试和评估。它包含了多种逻辑形式的问题,如一阶逻辑、高阶逻辑、命题逻辑等。
www.tptp.org 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录