five

coffee-first-crack-audio

收藏
Hugging Face2026-04-14 更新2026-04-15 收录
下载链接:
https://huggingface.co/datasets/syamaner/coffee-first-crack-audio
下载链接
链接失效反馈
官方服务:
资源简介:
Coffee First Crack Audio Dataset 是一个用于训练咖啡烘焙过程中第一次爆裂声检测模型的音频数据集。数据集包含来自咖啡烘焙录音的10秒WAV片段,标注为“first_crack”(爆裂声)或“no_first_crack”(背景噪音)。数据集总共有973个片段,采样率为16kHz,分为训练集(587个样本)、验证集(195个样本)和测试集(191个样本),且确保录音级别的分割以避免数据泄露。数据标注采用Label Studio进行,标注方法为滑动固定10秒窗口并根据与标注区域的重叠比例(≥50%)进行标记。数据集还包含麦克风类型和咖啡产地等附加信息。适用于音频分类任务,特别是咖啡烘焙过程中的声音检测。
创建时间:
2026-04-05
原始信息汇总

Coffee First Crack Audio 数据集概述

数据集基本信息

  • 数据集名称:Coffee First Crack Audio
  • 创建者:Sertan Yamaner
  • 发布日期:2026年
  • 许可协议:Apache-2.0
  • 语言:英语
  • 任务类别:音频分类
  • 标签:coffee, roasting, first-crack, audio, spectrogram
  • 数据规模:n<1K

数据集内容与结构

  • 总样本数:973个音频块
  • 数据格式:10秒单声道WAV片段,采样率为16kHz
  • 标注类别
    • first_crack:咖啡一爆(爆裂声)
    • no_first_crack:烘焙背景噪音
  • 类别分布:20% first_crack,80% no_first_crack(模拟真实类别不平衡)
  • 数据划分
    • 训练集:587个样本(来自9段录音)
    • 验证集:195个样本(来自3段录音)
    • 测试集:191个样本(来自3段录音)
  • 划分原则:按录音级别划分,确保各数据子集间无数据泄露

数据特征字段

特征名 数据类型 描述
audio 音频(16kHz) 10秒单声道WAV音频块
label 字符串 first_crackno_first_crack
label_id 整数 1 对应 first_crack,0 对应 no_first_crack
microphone 字符串 录音麦克风类型(mic-1-originalmic-2-new
coffee_origin 字符串 咖啡产地(如 brazil, costarica-hermosa, brazil-santos

数据来源与构成

  • 源录音数量:15段
  • 麦克风类型
    • mic-1-original:9段录音(来自原型项目)
    • mic-2-new:6段录音(2026年2月及4月新录制)
  • 咖啡产地
    • costarica-hermosa:5段录音(使用mic-1-original录制)
    • brazil:8段录音(4段使用mic-1-original,4段使用mic-2-new
    • brazil-santos:2段录音(使用mic-2-new录制)

标注方法

  1. 在Label Studio中对每段源录音标注一个单一的一爆区域,范围从第一个可听见的爆裂声开始,到持续的爆裂声结束。
  2. 使用chunk_audio.py脚本,以固定10秒窗口(无重叠)滑动切分每段录音。
  3. 根据每个窗口与标注的一爆区域的重叠程度(阈值>=50%)为其分配标签。

相关资源

  • 预训练模型:https://huggingface.co/syamaner/coffee-first-crack-detection
  • 源代码:https://github.com/syamaner/coffee-first-crack-detection
  • 构建过程说明:https://dev.to/syamaner/part-1-the-architecture-the-agent-spec-driven-ml-development-with-warpoz-3al6
  • 原始原型说明:https://dev.to/syamaner/part-1-training-a-neural-network-to-detect-coffee-first-crack-from-audio-an-agentic-development-1jei

引用格式

bibtex @misc{yamaner2026coffeefc, author = {Yamaner, Sertan}, title = {Coffee First Crack Audio Dataset}, year = {2026}, url = {https://huggingface.co/datasets/syamaner/coffee-first-crack-audio} }

搜集汇总
数据集介绍
main_image_url
构建方式
在咖啡烘焙过程的音频分析领域,该数据集通过系统化方法构建而成。原始录音来源于15段不同麦克风与咖啡产地的烘焙过程记录,每段录音均在Label Studio平台上标注出单一的首爆声音区域,即从首次可闻爆裂声开始至连续爆裂结束的时段。随后,采用固定10秒滑动窗口且无重叠的方式对录音进行切分,依据窗口与标注区域重叠比例是否超过50%的阈值,自动为每个音频片段分配“first_crack”或“no_first_crack”标签,从而生成973个标准化训练样本。这种构建策略确保了数据标注的一致性,并有效模拟了模型在实际推理时所处理的音频场景。
特点
该数据集呈现出若干显著特征,其核心在于专注于咖啡烘焙中首爆声音的检测任务。数据集共包含973个10秒单声道音频片段,采样率为16kHz,并按照录音级别划分为训练、验证与测试集,避免了数据泄露风险。样本标签分布呈现现实中的类别不平衡,首爆类别约占20%,非首爆类别约占80%,真实反映了烘焙过程中首爆声音的相对稀疏性。此外,数据集中还提供了麦克风类型与咖啡产地等元信息,如“mic-1-original”与“mic-2-new”两种设备以及巴西、哥斯达黎加等不同产地,为研究音频特征与设备、原料的关联性提供了丰富维度。
使用方法
利用该数据集进行模型开发与评估时,用户可通过Hugging Face的datasets库便捷加载。调用load_dataset函数并指定数据集名称,即可获取已划分好的训练、验证与测试子集。每个样本均以字典形式提供音频数据、文本标签、整数标签ID及元数据字段。研究人员可直接将其输入音频分类模型进行训练,或进一步提取频谱图等特征以探索声音模式。数据集的标准化格式与清晰的分割设计,支持用户快速开展实验,并基于录音级别的分割确保评估结果的可靠性,从而推动咖啡烘焙过程自动化监测技术的进步。
背景与挑战
背景概述
咖啡烘焙过程中,一爆阶段是决定咖啡豆风味发展的关键节点,其声音特征识别对自动化烘焙控制具有重要意义。该数据集由研究人员Sertan Yamaner于2026年构建,旨在为音频分类模型提供训练数据,以检测咖啡烘焙录音中的一爆声音。数据集包含来自两种麦克风和三种咖啡产地的15段原始录音,通过固定时长的滑动窗口切分为973个音频片段,并标注为一爆或非一爆类别。该数据集的建立推动了咖啡烘焙工艺的智能化研究,为精准识别烘焙阶段提供了可靠的数据基础。
当前挑战
在咖啡烘焙音频识别领域,核心挑战在于从复杂的背景噪声中准确分离出微弱且不规律的一爆声音信号,这要求模型具备较强的时序特征捕捉与抗干扰能力。数据集构建过程中,面临录音环境差异、麦克风设备不一致以及咖啡产地多样性带来的声学特征变异等挑战。此外,数据集中存在类别不平衡现象,一爆样本仅占20%,这增加了模型训练的难度,需采用适当的采样或加权策略以提升分类性能。
常用场景
经典使用场景
在咖啡烘焙的声学分析领域,该数据集为训练咖啡一爆检测模型提供了标准化的音频资源。其核心应用场景在于通过机器学习方法,从烘焙录音中自动识别一爆阶段的特征性爆裂声。研究者利用这些标注的10秒音频片段,构建分类模型以区分一爆声与背景噪音,从而实现对烘焙关键节点的精准监控。
解决学术问题
该数据集有效解决了咖啡烘焙过程中基于音频的事件检测难题,为小样本、不平衡数据的声学分类研究提供了实证基础。其意义在于将传统依赖人工经验的烘焙判断转化为可量化的计算任务,推动了农业声学与轻工业智能监测的交叉研究。通过提供多麦克风、多产地的录音,它促进了模型在跨设备与跨原料场景下的泛化能力评估。
衍生相关工作
围绕该数据集,已衍生出基于深度学习的端到端检测模型,如公开的‘coffee-first-crack-detection’项目,展示了完整的模型训练与部署流程。相关研究进一步探索了时频特征提取、数据增强策略以及轻量化模型部署,为边缘计算在食品加工中的应用提供了范例。这些工作共同构成了一个从数据构建到实际应用的完整技术生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作