Zema Dataset

Name: Zema Dataset
Creator: 中央研究院信息科学研究所, 台湾大学信息管理系统, 台湾科技大学信息管理系, 台湾科技大学材料科学与工程系, 台湾国际研究生院社交网络与人类中心计算项目, 台湾政治大学计算机科学系, 贡德尔大学信息系统系
Published: 2024-12-25 13:20:08
License: 暂无描述

arXiv2024-12-25 更新2024-12-31 收录

下载链接：

https://github.com/mequanent/ChantingModeClassification

下载链接

链接失效反馈

官方服务：

资源简介：

Zema Dataset是由中央研究院信息科学研究所等机构共同创建的一个专门用于分析埃塞俄比亚东正教特瓦赫多教会（EOTC）圣歌的数据集。该数据集包含10小时的音频数据，共369条实例，涵盖了详细的单词级别时间边界、阅读音调标注以及圣歌模式标签。数据来源于Eat the Book网站，经过严格的预处理和质量控制，包括音频清理、分段和文本提取。该数据集旨在支持圣歌模式分类、歌词转录、歌词与音频对齐以及音乐生成等任务，推动对埃塞俄比亚独特宗教音乐文化的保护与研究。

The Zema Dataset is a specialized dataset co-developed by the Institute of Information Science, Academia Sinica, and other institutions for the analysis of chant music of the Ethiopian Orthodox Tewahedo Church (EOTC). It contains 10 hours of audio data and a total of 369 instances, which include detailed word-level temporal boundaries, recitation tone annotations, and chant mode labels. Sourced from the Eat the Book website, the dataset has undergone rigorous preprocessing and quality control procedures, including audio cleaning, segmentation, and text extraction. This dataset aims to support tasks such as chant mode classification, lyric transcription, lyric-audio alignment, and music generation, thereby promoting the preservation and academic research of Ethiopia's unique religious musical culture.

提供机构：

中央研究院信息科学研究所, 台湾大学信息管理系统, 台湾科技大学信息管理系, 台湾科技大学材料科学与工程系, 台湾国际研究生院社交网络与人类中心计算项目, 台湾政治大学计算机科学系, 贡德尔大学信息系统系

创建时间：

2024-12-25

搜集汇总

数据集介绍

构建方式

Zema数据集的构建过程始于从Eat the Book网站手动收集音频数据，该网站是埃塞俄比亚东正教Tewahedo教会（EOTC）教学资源的集中地。研究人员选择了Se’atat Zema（Horologium chant）作为数据源，所有音频均以44,100 Hz的采样率和立体声通道录制。随后，音频数据经过预处理，包括将超过13分钟的音频分割为不超过3分钟的片段，并移除非吟唱部分。文本数据则通过PDF文档和书籍照片提取，经过清理、重复文本处理以及拼写校正等步骤。最终，数据集通过Audacity软件进行详细的词级时间边界标注，并记录了吟唱模式、阅读音调和吟唱选项等标签。

使用方法

Zema数据集可用于多种音乐信息检索和音乐生成任务。研究人员可以利用该数据集进行吟唱模式分类，通过提取音频的梅尔频率倒谱系数（MFCC）等特征，训练机器学习模型。此外，数据集还可用于歌词转录和歌词与音频对齐任务，帮助自动生成歌词文本并将其与音频同步。对于音乐生成任务，数据集提供了丰富的吟唱模式和选项，可用于生成符合EOTC传统的音乐作品。数据集的多模态特性也支持更深入的音乐分析，促进对埃塞俄比亚传统吟唱的学术研究。

背景与挑战

背景概述

Zema Dataset是由Mequanent Argaw Muluneh等人于2024年提出的一个专注于埃塞俄比亚正教特瓦赫多教会（EOTC）圣咏（Yaredawi Zema）研究的音乐数据集。该数据集旨在填补计算音乐研究中对于EOTC圣咏的空白，特别是针对Horologium圣咏的分析。数据集包含10小时的音频数据，共计369个实例，涵盖了详细的词级时间边界、阅读音调标注以及相应的圣咏模式标签。通过提供音频、歌词文本和阅读音调标签，该数据集支持多种任务，如圣咏模式分类、歌词转录、歌词与音频对齐以及音乐生成。这一数据集的发布旨在促进对EOTC圣咏的深入研究，推动这一独特宗教音乐文化的保护与传承。

当前挑战

Zema Dataset在构建过程中面临了多方面的挑战。首先，EOTC圣咏的复杂性和多样性使得标注工作极为繁琐，尤其是在处理词级时间边界和阅读音调时，需要极高的精确度。其次，圣咏模式的多变性和符号系统的复杂性增加了数据标注的难度，尤其是在区分不同模式下的圣咏选项时，容易产生混淆。此外，数据集的构建依赖于手工收集和整理，音频与歌词的匹配过程耗时且容易出错，尤其是在处理重复段落和可选圣咏时，需要反复验证以确保数据的准确性。这些挑战不仅影响了数据集的构建效率，也对后续的研究提出了更高的技术要求。

常用场景

经典使用场景

Zema Dataset 主要用于计算音乐研究领域，特别是针对埃塞俄比亚正教特瓦赫多教会（EOTC）圣歌的分析。该数据集通过提供详细的音频、歌词文本和阅读音调标签，支持圣歌模式分类、歌词转录、歌词与音频对齐以及音乐生成等任务。其经典使用场景包括利用机器学习算法对圣歌模式进行自动识别和分类，以及通过深度学习模型生成符合传统风格的圣歌。

解决学术问题

Zema Dataset 解决了计算音乐研究中埃塞俄比亚正教圣歌数据稀缺的问题，填补了这一文化领域的研究空白。通过提供高质量的标注数据，该数据集支持了圣歌模式识别、歌词转录和音乐生成等任务的研究，推动了音乐信息检索和音乐生成技术的发展。此外，该数据集还为文化保护和传承提供了技术手段，帮助保存和传播这一独特的宗教音乐遗产。

实际应用

Zema Dataset 在实际应用中具有广泛的价值，特别是在教育和文化保护领域。通过该数据集，研究人员可以开发出自动化的圣歌学习工具，帮助学习者更快地掌握复杂的圣歌模式。此外，该数据集还可用于开发音乐生成系统，生成符合传统风格的圣歌，用于宗教仪式或文化展示。这些应用不仅提高了圣歌学习的效率，还促进了埃塞俄比亚宗教音乐的传播和保存。

数据集最近研究