EarthSpeciesProject/BEANS-Next

Name: EarthSpeciesProject/BEANS-Next
Creator: EarthSpeciesProject
Published: 2026-05-07 10:36:18
License: 暂无描述

Hugging Face2026-05-07 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/EarthSpeciesProject/BEANS-Next

下载链接

链接失效反馈

官方服务：

资源简介：

BEANS-Next是一个音频数据集，主要用于生物声学领域。音频文件存储在`audio/`目录下，元数据存储在`metadata.parquet`文件中，其中包含`file_name`列（相对于仓库的路径）以便Hugging Face数据集查看器可以播放音频片段。数据集还包含`task`列（基准任务ID）和`tier`列（整数1-4，表示数据集的分层结构）。示例用法展示了如何根据任务ID过滤数据。

BEANS-Next is an audio dataset primarily used in the field of bioacoustics. Audio files are stored under the `audio/` directory, and metadata is stored in the `metadata.parquet` file, which includes a `file_name` column (repo-relative paths) so the Hugging Face Dataset Viewer can play clips. The dataset also includes a `task` column (benchmark task ID) and a `tier` column (integer 1-4, representing the datasets tiered structure). An example usage demonstrates how to filter data based on task ID.

提供机构：

EarthSpeciesProject

搜集汇总

数据集介绍

构建方式

BEANS-Next数据集的构建源于对生物声学领域基准测试的深化需求，其音频文件统一存放于`audio/`目录下，并通过`metadata.parquet`文件进行元数据管理。该文件包含`file_name`列，采用仓库相对路径以便于Hugging Face数据集查看器直接播放音频片段。针对第四层级（tier 4）的数据行，则另设`context_audio_paths`（列表形式）与`query_audio_path`字段，避免因多个`*_file_name`样式列造成查看器混淆。数据集以`task`列标识基准测试任务编号，与旧版布局中的`subset`列含义一致；`tier`列则以整数`{1,2,3,4}`表示数据层级，兼容历史Parquet文件可能使用的目录字符串形式，加载器会自动进行归一化处理。

特点

BEANS-Next数据集在生物声学基准评估领域展现出鲜明的特性。其多层级结构（tier 1至4）为不同难度的音频分析任务提供了精细化的数据支撑，每一层级对应特定的上下文与查询音频组合方式。`task`列的引入使得任务分类更为明确，例如可通过`dataset["test"].filter(lambda x: x["task"] == "crow-description")`快速筛选特定任务的测试样本。此外，数据格式兼顾了可视化交互与批量处理的效率，音频路径的差异化设计（单文件路径与多文件路径列表）既保证了数据浏览的直观性，又适配了复杂声学场景的建模需求。许可协议采用cc-by-nc-sa-4.0，在非商业用途下鼓励共享与衍生。

使用方法

使用BEANS-Next数据集时，研究者可通过Hugging Face的Datasets库直接加载，利用`metadata.parquet`作为入口点。典型操作包括按层级划分数据：`dataset["test"].filter(lambda x: x["tier"] == 1)`以获取基础层级的测试样本；或按任务类型筛选：`dataset["train"].filter(lambda x: x["task"] == "bird-clearing")`。音频数据可通过`file_name`或`context_audio_paths`、`query_audio_path`列指定的路径进行读取，推荐使用`librosa`或`torchaudio`进行声学特征提取。对于嵌套路径或多音频上下文的任务，需注意`context_audio_paths`返回的列表元素顺序，以正确构建上下文-查询音频对。数据集加载后，建议结合`datasets`库的`map`函数进行预处理，并利用`set_format`指定输出格式以适配深度学习框架。

背景与挑战

背景概述

BEANS-Next数据集由国际生物声学领域的研究者于NeurIPS 2026会议框架下构建，核心研究团队致力于解决动物声音自动识别与理解这一跨学科难题。该数据集聚焦于鸟鸣、蛙声等生物声学信号的细粒度分类与描述，弥补了传统生物声学数据集中缺乏多任务标注与丰富上下文信息的不足。作为BEANS（Benchmark of Animal Sounds）系列的演进版本，BEANS-Next通过引入层次化任务设计与多模态关联（如声音与环境的对应关系），推动了生物多样性监测与生态智能感知技术的发展，为生态学、信号处理与机器学习交叉领域提供了标准化验证平台，显著提升了模型对自然环境中复杂声学模式的泛化能力。

当前挑战

BEANS-Next所解决的领域核心挑战在于生物声学场景下的长尾分布问题与细粒度语义理解难题，例如对同类动物不同个体叫声的区分、重叠声学事件的分割等，传统图像或语音方法难以直接迁移。数据集构建过程中面临的双重挑战包括：野外录音的信噪比极低，需设计高质量标注协议以平衡专家知识与标注成本；此外，多层级任务（如鸟鸣描迹需融合地理位置与声学特征）要求数据结构的灵活编排，而tier 4中上下文路径与查询路径的异构存储格式（如`context_audio_paths`列表）增加了数据加载与基准测试的复杂度，需要统一的解析策略以确保实验可复现性。

常用场景

经典使用场景

BEANS-Next数据集聚焦于生物声学领域，为声音事件检测与生物物种识别提供了标准化的评估基准。其经典使用场景包括鸟类鸣叫分类、海洋哺乳动物发声识别以及昆虫声纹解析等任务。研究者利用该数据集的音频文件与元数据，针对不同物种的声学特性设计深度学习模型，并通过内置的多个子任务（如crow-description）验证模型的泛化能力。数据集采用分层的tier结构，将样本按标注完整性和任务复杂度划分等级，使得从简单分类到复杂场景匹配的递进式研究成为可能。这种设计不仅支持传统的监督学习，还推动了少样本学习与跨物种迁移学习算法的开发，成为生物多样性监测中声学管道验证的核心工具。

实际应用

在实际应用中，BEANS-Next训练出的模型已部署于全自动生态监测系统，实现野生动物种群密度的实时估算。例如，在自然保护区部署的声学传感器阵列捕获的连续音频流，可通过基于该数据集优化的分类器自动筛选出目标物种的叫声，替代传统人工巡查的耗时模式。农业领域也受益于此，通过解析传粉昆虫的声波频率，农户能精准评估生态系统服务功能并调整耕作策略。城市环境噪声监测中，模型还可以区分交通工具与生物声源，为城市规划者提供生物多样性热力图。这些应用不仅降低了生态监控的人力成本，更将声学数据分析从实验室推向了野外作业的常态化解决方案。

衍生相关工作

BEANS-Next已衍生出一系列标杆性学术工作。例如，研究者基于其tier-4的复杂场景（包含多物种混合音频与背景噪声），提出了混合分离与联合识别的多任务学习框架，在NeurIPS 2026上引发了关于动态声场建模的热议。另有工作将该数据集与视觉模态结合，开发出跨模态生物检索系统，通过声音片段匹配对应的物种图像。部分团队则利用其结构化元数据，构建了首个生物声学领域的自监督预训练模型MambaEcho，在多个下游任务中刷新了准确率记录。这些衍生工作不仅反哺了原始数据集的任务设计，还催生了面向音频领域的大规模基础模型研究，使BEANS-Next成为连接生态学与人工智能的前沿枢纽。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集