SongEval

github2025-05-16 更新2025-05-17 收录

下载链接：

https://github.com/ASLP-lab/SongEval

下载链接

链接失效反馈

官方服务：

资源简介：

SongEval是第一个大规模、开源的人类感知歌曲美学数据集，用于评估歌曲在五个感知美学维度上的表现。

SongEval is the first large-scale, open-source human-perceived song aesthetics dataset designed to evaluate songs across five perceptual aesthetic dimensions.

创建时间：

2025-05-14

原始信息汇总

SongEval数据集概述

数据集简介

名称：SongEval
类型：歌曲美学评估基准数据集
特点：首个大规模开源的基于人类感知的歌曲美学数据集

核心功能

提供预训练神经网络模型用于感知美学评估
可预测五个美学维度：
- 整体连贯性
- 记忆性
- 人声呼吸和乐句的自然性
- 歌曲结构的清晰度
- 整体音乐性
支持完整歌曲（人声+伴奏）作为输入

技术特性

支持单音频文件评估
支持音频文件列表评估
支持目录批量评估
支持CPU强制评估模式（速度较慢）

安装与使用

安装方法： bash git clone https://github.com/ASLP-lab/SongEval.git cd SongEval pip install -r requirements.txt
评估命令示例：
- 单文件评估：python eval.py -i /path/to/audio.mp3 -o /path/to/output
- 文件列表评估：python eval.py -i /path/to/audio_list.txt -o /path/to/output
- 目录批量评估：python eval.py -i /path/to/audio_directory -o /path/to/output
- CPU模式评估：python eval.py -i /path/to/audio.wav -o /path/to/output --use_cpu

许可信息

许可证类型：CC BY-NC-SA 4.0
使用限制：仅限非商业用途，需署名

致谢

上海音乐学院提供音乐理论、美学和标注设计方面的专家指导

引用格式

bibtex @inproceedings{SongEval, title = {SongEval: A Large-Scale Benchmark Dataset for Aesthetic Evaluation of Complete Songs}, author = {...}, booktitle = {...}, year = {2025} }

搜集汇总

数据集介绍

构建方式

SongEval数据集作为首个大规模开源的歌曲美学评估基准，其构建过程体现了严谨的跨学科合作。研究团队联合上海音乐学院的专业音乐人士，基于音乐美学理论设计了涵盖整体连贯性、记忆度、人声呼吸与乐句自然度、歌曲结构清晰度、整体音乐性等五个维度的评估体系。通过系统化的数据采集流程，收集了涵盖多种风格的高质量完整歌曲（人声+伴奏），并由专业音乐人进行多维度标注，确保了数据集的权威性和代表性。

特点

该数据集最显著的特点是建立了完整的歌曲美学评估范式。其预训练神经网络模型能够精准捕捉人类感知的审美维度，支持对完整长度歌曲的直接评估。五个精心设计的评估维度既相互独立又有机统一，全面覆盖了专业音乐人关注的审美要素。数据集特别注重评估指标的实用性，支持单文件、文件列表和目录批处理等多种输入方式，为音乐生成模型的性能评测提供了标准化工具。

使用方法

使用SongEval数据集进行美学评估具有高度便捷性。用户只需通过简单的命令行接口，指定输入音频路径和输出目录即可完成评估流程。系统支持MP3等常见音频格式，既能处理单个文件也能批量评估。对于没有GPU加速的环境，可通过--use_cpu参数强制使用CPU运算。评估结果将生成标准化报告，便于研究人员进行定量分析和模型优化。整个评估过程封装完善，用户无需具备专业的音乐理论知识即可获得可靠的美学评分。

背景与挑战

背景概述

SongEval数据集由ASLP-lab与上海音乐学院合作开发，作为首个面向完整歌曲美学评估的大规模开源数据集，于2025年正式发布。该数据集聚焦音乐生成领域长期存在的审美量化难题，通过专业音乐家标注构建了涵盖整体连贯性、记忆度、人声呼吸乐句自然度、歌曲结构清晰度、整体音乐性等五个维度的评价体系。其创新性地将主观美学感知转化为可计算的客观指标，为AI音乐生成模型的优化提供了重要基准，推动了计算音乐学与认知美学的交叉研究发展。

当前挑战

在解决音乐美学量化评估这一核心问题时，SongEval面临多维感知指标建模的复杂性挑战，需平衡专业音乐理论与大众审美偏见的差异。数据集构建过程中，完整歌曲的时长变异性和多轨道混合特征对音频特征提取提出更高要求，而跨文化音乐审美标准的统一标注则依赖上海音乐学院专家的深度参与。此外，保持评估模型在生成音乐与人工创作音乐间的判别公平性，亦是该工具包实际应用中的关键挑战。

常用场景

经典使用场景

在音乐信息检索领域，SongEval数据集为研究者提供了一个标准化的评估框架，用于量化生成歌曲的美学质量。通过预训练的神经网络模型，该数据集能够自动评估完整歌曲在五个关键美学维度上的表现，包括整体连贯性、记忆性、自然度、结构清晰度和整体音乐性。这一工具特别适用于比较不同音乐生成算法的输出质量，为算法优化提供了客观依据。

解决学术问题

SongEval数据集解决了音乐美学评估中缺乏大规模、标准化基准的学术难题。传统上，音乐美学评估依赖于主观的人工评判，难以实现规模化。该数据集通过专业音乐家的标注和机器学习模型的结合，建立了一个可重复、可扩展的评估体系。这一突破为音乐生成、音乐推荐系统的研究提供了可靠的评估标准，推动了计算音乐学领域的发展。

衍生相关工作

基于SongEval数据集，研究者们开发了一系列相关的工作。其中包括改进的音乐生成模型，这些模型利用SongEval的评估结果作为强化学习的奖励信号。还有研究者将该数据集扩展到跨文化音乐美学比较领域，探索不同地区听众的审美差异。此外，一些工作尝试将SongEval的评估维度与其他音乐特征相结合，构建更全面的音乐质量预测模型。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集