EarthSpeciesProject/beans-next-small

Name: EarthSpeciesProject/beans-next-small
Creator: EarthSpeciesProject
Published: 2026-05-06 13:29:20
License: 暂无描述

Hugging Face2026-05-06 更新2026-05-10 收录

下载链接：

https://hf-mirror.com/datasets/EarthSpeciesProject/beans-next-small

下载链接

链接失效反馈

官方服务：

资源简介：

BEANS-Next是一个生物声学音频数据集，包含音频文件和元数据。音频文件存储在`audio/`目录下，元数据存储在`metadata.parquet`文件中，包含`file_name`列（相对路径）、`task`列（基准任务ID）和`tier`列（整数1-4）。数据集用于基准任务，支持多种任务类型。

BEANS-Next is a bioacoustics audio dataset containing audio files and metadata. Audio files are stored under `audio/`, and metadata is in `metadata.parquet` with columns like `file_name` (repo-relative paths), `task` (benchmark task id), and `tier` (integer 1-4). The dataset is used for benchmarking tasks and supports various task types.

提供机构：

EarthSpeciesProject

搜集汇总

数据集介绍

构建方式

该数据集基于BEANS-Next项目构建，音频文件统一存放于audio/目录下，元数据则记录在metadata.parquet文件中。其中包含file_name列，用于存储相对于仓库的音频路径，以便Hugging Face数据集查看器直接播放片段。针对第四层级的数据行，数据集另行采用context_audio_paths列表与query_audio_path字段来记录上下文及查询音频的路径，避免查看器被多个类似*_file_name的列所混淆。此外，task列标识基准测试任务ID，tier列以整数1至4表示层级划分，支持从遗留Parquet格式中自动规范化处理。

使用方法

用户可通过Hugging Face Datasets库直接加载该数据集，利用filter方法依据task列或tier列精准筛选所需子集，例如dataset['train'].filter(lambda x: x['task'] == 'crow-description')可提取特定任务的样本。元数据中的file_name列提供音频文件的相对路径，支持与audio/目录配进行读取与播放。对于第四层级样本，需通过context_audio_paths和query_audio_path字段分别获取上下文与查询音频路径。建议用户结合Bioacoustics领域的专业知识，根据tier层级选择合适的评估策略，以充分发挥该数据集在多任务音频分析中的价值。

背景与挑战

背景概述

BEANS-Next数据集由生物声学领域的研究团队创建，于2023年发布，旨在推动动物声音事件检测与分类技术的发展。该数据集聚焦于从自然环境中提取的音频信号，包含多种鸟类、哺乳动物及昆虫的鸣叫声，核心研究问题在于如何利用深度学习模型实现高精度的生物声学识别。其影响力体现在为跨物种声音分析提供了标准化基准，促进了生态监测和生物多样性保护中的自动化工具研发。通过公开不同物种的音频片段及标注元数据，BEANS-Next已成为连接声学信号处理与生态学的关键桥梁，推动了领域内从传统手工特征向端到端学习范式的转变。

当前挑战

BEANS-Next面临的核心挑战包括：首先，自然环境中背景噪声复杂多变，如风声、雨声及人为噪音，严重干扰目标声音的分离与识别，这要求模型具备强鲁棒性和泛化能力。其次，数据集构建过程中需解决音频长尾分布问题，部分物种样本稀少，导致模型过拟合风险增加。此外，不同录音设备与采样率的差异引入数据异构性，增加了预处理难度。在标注环节，跨物种声音的细微相似性需要专家进行判别，人工成本高昂且易产生不一致性，这促使研究者探索半监督或主动学习策略以优化数据质量与标注效率。

常用场景

经典使用场景

BEANS-Next（简称beans-next-small）是一个专注于生物声学（bioacoustics）领域的音频数据集，其核心设计旨在推动动物声音识别与理解的研究。该数据集通过组织四层递进式的任务层级（tier1至4），涵盖了从简单的个体声学信号检测到复杂的上下文相关声学场景分析，为评估和训练模型在真实生物声学环境下的鲁棒性提供了标准化基准。最经典的使用场景包括鸟类鸣声分类、蛙类叫声识别以及哺乳动物声音事件检测，研究者可以借助该数据集的高质量标注元数据（metadata.parquet），结合任务标识符（task）高效地进行模型性能验证与跨物种声学特征对比研究。

解决学术问题

该数据集针对生物声学领域长期存在的三大核心学术问题提供了系统性解决方案：一是缺乏大规模、多物种、多场景的标准评估基准，BEANS-Next通过统一的Parquet格式元数据与规范化任务标识符，填补了这一空白；二是模型在复杂声学环境（如噪声干扰、多源混合）下的泛化能力难以量化，其四层任务层级结构（tier1-4）从单一信号分类逐步过渡到基于上下文的查询-检索任务，为研究模型在不同难度级别上的表现提供了可复现的测试框架；三是推动了动物声音理解从简单识别走向语义级场景解析，促进了跨学科研究如生态监测与机器学习方法的深度融合。

实际应用

在实际应用层面，BEANS-Next数据集为自动化生态监测系统的研发提供了关键支撑。例如，生物多样性保护机构可利用基于该数据集训练的模型，从野外观测站采集的长时间音频记录中自动识别濒危物种的存在与活动频率，显著降低人工标注成本。此外，该数据集还能服务于农业智能设备，通过识别田间蛙类或鸟类声音来评估农药使用对环境的影响，或协助机场驱鸟系统精准区分危险鸟类与无害种类。在智慧城市领域，基于BEANS-Next的声学模型可用于城市公园的生物声景监测，辅助环保部门实时跟踪生物群落动态，为城市生态规划提供数据驱动决策依据。

数据集最近研究