PJS Manual Labels

github2023-10-14 更新2024-05-31 收录

下载链接：

https://github.com/UtaUtaUtau/pjs-manual-labels

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个对PJS singing corpus进行手动重新标注的数据集，旨在修正原数据集中存在的标签错误。仅对歌唱样本进行了重新标注。标签遵循HTK单声道标签格式，并使用vLabeler工具制作。所用的音素系统与原数据集相同，但增加了对声门闭锁音的标注。

This dataset represents a manually re-annotated version of the PJS singing corpus, aimed at correcting label errors present in the original dataset. Only the singing samples have been re-annotated. The labels adhere to the HTK monophonic label format and were created using the vLabeler tool. The phoneme system used is identical to that of the original dataset, with the addition of annotations for glottal stops.

创建时间：

2023-10-04

原始信息汇总

PJS Manual Labels 数据集概述

数据集描述

原始数据来源：PJS singing corpus
目的：修正原始数据集中的标签错误
标签类型：仅对歌唱样本进行重新标签
标签格式：HTK mono label格式
标签工具：使用vLabeler进行标签制作
语音系统：与原始数据集相同，额外使用cl表示喉塞音

许可证

许可证类型：CC BY-SA 4.0

搜集汇总

数据集介绍

构建方式

PJS Manual Labels数据集是对PJS歌唱语料库的重新标注，旨在修正原始语料库中存在的标签错误。该数据集仅对歌唱样本进行了重新标注，标注过程由人工完成，确保了标签的准确性。标注工具采用了vLabeler，标注格式遵循HTK单音标签格式。尽管音素系统与原始语料库保持一致，但在处理声门塞音时，额外引入了`cl`标签，以更精确地反映语音特征。

特点

PJS Manual Labels数据集的主要特点在于其高精度的标签质量。由于标注过程完全由人工完成，且标注者对其准确性充满信心，因此该数据集在语音研究领域具有较高的可靠性。此外，数据集的标签格式与HTK兼容，便于与现有的语音处理工具链集成。音素系统的微调也使得该数据集在处理特定语音现象时更具灵活性。

使用方法

PJS Manual Labels数据集的使用方法较为直观，用户可以直接下载数据集并加载到支持HTK标签格式的语音处理工具中进行使用。由于数据集采用CC BY-SA 4.0许可证，用户可以在遵守许可条款的前提下自由使用、修改和分享该数据集。若在使用过程中发现标签错误，用户可以通过提交Pull Request的方式参与数据集的改进，从而进一步提升数据集的准确性。

背景与挑战

背景概述

PJS Manual Labels数据集是对PJS歌唱语料库进行人工重新标注的产物，旨在修正原始语料库中存在的标签错误。该数据集由研究人员Shinnosuke Takamichi等人创建，基于其早期开发的PJS歌唱语料库，主要用于语音合成和歌唱分析领域。PJS歌唱语料库自发布以来，因其高质量的歌唱样本和详细的音素标注，在语音合成研究中占据重要地位。然而，原始标签中的错误限制了其进一步应用。PJS Manual Labels通过人工重新标注，显著提升了标签的精确性，为相关研究提供了更可靠的数据支持。该数据集采用HTK单音标签格式，并使用vLabeler工具进行标注，确保了标注的一致性和可重复性。

当前挑战

PJS Manual Labels数据集的主要挑战在于其标注的精确性和一致性。尽管原始PJS歌唱语料库在语音合成领域具有重要价值，但其标签中的错误影响了数据的可靠性。重新标注过程中，研究人员需要克服原始标签中的模糊性和错误，确保每个音素标签的准确性。此外，标注工作依赖于人工操作，尽管标注者声称标签高度精确，但仍可能存在潜在的错误或遗漏。另一个挑战在于标注工具的选择和标注格式的统一。vLabeler工具的使用虽然提高了标注效率，但其对标注者的技术要求较高，可能增加标注的复杂性。最后，数据集的开放性和可扩展性也面临挑战，尽管鼓励用户提交修正请求，但如何高效管理和整合这些修正仍需进一步优化。

常用场景

经典使用场景

在音乐信息检索领域，PJS Manual Labels数据集被广泛应用于歌唱语音分析的研究中。通过提供精确的手动标注，该数据集为研究者提供了一个可靠的基准，用于开发和测试歌唱语音分割、音素识别以及歌唱风格分析等算法。其高质量的标注数据使得研究者能够更准确地评估模型的性能，从而推动相关技术的发展。

衍生相关工作

PJS Manual Labels数据集的发布催生了一系列相关研究，特别是在歌唱语音分析和音乐信息检索领域。基于该数据集，研究者开发了多种先进的音素识别模型和歌唱风格分类算法。此外，该数据集还被用于跨语言歌唱语音分析的研究，推动了多语言音乐信息检索技术的发展。这些工作进一步扩展了数据集的应用范围，提升了其在学术界的影响力。

数据集最近研究