osu2beat2025
收藏arXiv2025-09-16 更新2025-09-18 收录
下载链接:
https://github.com/ziyunliu4444/osu2mir
下载链接
链接失效反馈官方服务:
资源简介:
osu2beat2025数据集是由卡内基梅隆大学研究者从Osu!社区节拍图提取的高质量节拍和重拍注释数据集。该数据集包含708首不同音频的741个注释,涵盖动画、Vocaloid和电子游戏音乐等不受传统数据集关注的类型。数据集通过社区驱动的方式不断更新,减少了个人偏见,并通过共识机制提高了注释质量,适用于音乐信息检索研究,特别是在节拍跟踪方面。
The osu2beat2025 dataset is a high-quality dataset of beat and downbeat annotations extracted from the beatmaps of the Osu! community by researchers at Carnegie Mellon University. It contains 741 annotations across 708 distinct audio tracks, covering genres such as anime, Vocaloid, and video game music, which are often overlooked by traditional datasets. The dataset is continuously updated in a community-driven manner, reducing individual biases and improving annotation quality through consensus mechanisms. It is suitable for music information retrieval (MIR) research, especially for beat tracking tasks.
提供机构:
卡内基梅隆大学
创建时间:
2025-09-16
原始信息汇总
Osu2MIR 数据集概述
数据集基本信息
- 数据集名称:Osu2MIR
- 研究背景:Beat Tracking Dataset Derived From Osu! Data (ISMIR2025 LBD)
- 论文链接:https://arxiv.org/abs/2509.12667
数据集内容
- 独立数据集:osu2beat2025_metered_beats.zip 包含计量节拍数据,涵盖 708 首独特音频的 741 个用户标注,命名格式为 MD5_BeatmapSetID_beats_metered.txt。
数据集构建步骤
- 下载谱面:使用 https://github.com/nzbasic/batch-beatmap-downloader 下载 .osz 文件(原始谱面文件),需筛选已排名谱面以确保质量。
- 数据分区:使用 data_partition.py 将 .osz 文件分组为:
- 单一非继承时间点
- 多个非继承时间点(间隔≥5秒)
- 多个非继承时间点(间隔<5秒)
- 子集1和子集2质量较高,子集3需谨慎使用。
- 转换为计量节拍:使用 data_conversion.py 将 .osz 文件转换为音频及对应的计量节拍标注(.txt 格式),用作节拍和强拍跟踪研究中的真实数据。
附加工具
- extract_uninherited_timing_points.py:提取非继承时间点(.json 格式)及对应音频。
- song_info_csv.py:提取谱面信息(标题、艺术家、创作者、标签、非继承时间点数量、MP3 时长)并汇总为 .csv 文件。
- self_track_madmom.py:用于运行 madmom 推理的管道(建议使用 GPU)。
- madmom_evaluation.py:用于比较 madmom 结果与用户标注的脚本。
数据表格
- .csv 文件为论文分析使用的原始表格:
- single:单一非继承时间点的歌曲
- geq5:多个非继承时间点(间隔≥5秒)的歌曲
- le5:多个非继承时间点(间隔<5秒)的歌曲
社区贡献
- 鼓励谱面创作者与 MIR 研究者共同开发工具以满足多样化需求。
- Discord:https://discord.gg/hYM3NkTzAW
搜集汇总
数据集介绍

构建方式
在音乐信息检索领域,数据稀缺与标注偏差长期制约着节拍追踪模型的演进。osu2beat2025数据集创新性地从社区驱动的节奏游戏《Osu!》中提取节拍与强拍标注,通过定制化下载器筛选已排名、包含“Insane”难度且收藏数超200的谱面,确保数据质量与节奏复杂性。利用自动化脚本解析.osu文件中的非继承性时间点,计算节拍时间戳与度量位置,最终生成结构化标注文件与对应音频。
特点
该数据集显著优势在于其多样性与社区共识机制。覆盖动漫、虚拟歌手及游戏音乐等传统数据集中罕见的流派,弥补了现有资源的风格空白。通过多用户对同一曲目的独立标注,有效降低个体偏差,而社区排名机制进一步保障了标注可靠性。数据分区策略(单时间点、长间隔多时间点、短间隔多时间点)为不同复杂度节奏研究提供了层次化支持。
使用方法
研究者可通过开源管道自定义数据提取流程,或直接使用发布的osu2beat2025高质量子集(含708首曲目的741条标注)。标注文件采用MD5_BeatmapSetID_beats_metered.txt命名格式,包含节拍时间与度量索引。需注意部分标注可能超出音频实际范围,建议根据研究需求裁剪音频末端。该数据集适用于节拍追踪模型训练、跨文化节奏分析及人机标注一致性研究。
背景与挑战
背景概述
音乐信息检索领域长期受限于传统节拍标注数据集规模有限、风格单一及更新缓慢的困境。2025年卡内基梅隆大学研究人员Ziyun Liu与Chris Donahue基于社区音游Osu!构建了osu2beat2025数据集,通过解析玩家创作的逾四万首节奏图谱,涵盖动画、虚拟歌手等传统数据集稀缺的音乐类型。该数据集采用自动化流水线提取节拍与强拍标注,通过时序点间隔阈值划分三级质量子集,为深度学习节拍追踪模型提供了兼具规模性与多样性的训练资源。
当前挑战
在解决节拍追踪任务时,该数据集需应对复杂节奏模式与非标准拍号的识别挑战,特别是多时序点图谱中存在的表达性时序偏移与歌词同步标注现象。数据构建过程中面临社区标注异构性难题:紧密间隔时序点(<5秒)易因编辑器功能限制产生非4/4拍号误标,需通过启发式阈值与人工审核确保标注可靠性;同时需处理音频与标注时序对齐偏差,以及跨文化音乐特有的节拍-歌词对齐模式解析。
常用场景
经典使用场景
在音乐信息检索领域,osu2beat2025数据集为节拍追踪任务提供了丰富而多样的标注资源。该数据集通过解析Osu!节奏游戏的社区创作图谱,涵盖了动画、Vocaloid和游戏音乐等传统数据集难以覆盖的小众流派,为模型训练与评估提供了前所未有的风格多样性。研究者可借助该数据集开发更鲁棒的节拍检测算法,特别是在处理复杂节奏变化和非标准拍号音乐时表现出显著优势。
解决学术问题
该数据集有效解决了传统节拍标注数据规模有限、流派覆盖狭窄以及标注主观性强三大核心问题。通过社区驱动的多标注者共识机制,它不仅提供了超过4万首曲目的海量标注,还显著降低了单标注者带来的系统性偏差。其引入的时序点分区策略(单时序点、长间隔多时序点、短间隔多时序点)为研究不同节奏复杂度场景下的算法性能提供了结构化评估框架,推动了音乐节奏分析领域的标准化进程。
衍生相关工作
该数据集催生了多项创新性研究,包括基于多时序点分析的节拍相位校正算法、跨文化音乐节奏模式比较研究,以及结合歌词-节拍对齐的多模态音乐理解模型。其数据提取管道被Adaptive Beat Transformer等后续工作扩展用于处理非4/4拍音乐,而针对社区标注偏差的统计分析则启发了ConsensusNet等集成学习框架的开发,推动了音乐信息检索领域向更民主化、社区驱动的范式转变。
以上内容由遇见数据集搜集并总结生成



