Project AI❤dol Public English Dataset

github2024-09-15 更新2024-09-16 收录

下载链接：

https://github.com/lottev1991/Project-AIdol-Public-English-Dataset

下载链接

链接失效反馈

官方服务：

资源简介：

由于公开的英语SVS数据严重缺乏，由女性歌手演唱的数据集尤为稀缺，因此决定发布自己的语料库。该数据集是完整数据集的一个精选，仅包含英语歌曲，并选择了最佳的演唱数据。标签仅使用默认的Arpabet音素。声音提供者不是英语母语者，但发音应该足够好。她也不是专业歌手，但演唱质量仍然可以接受。数据总时长为1小时45分钟。

Given the severe scarcity of publicly available English SVS datasets, especially those sung by female vocalists, we decided to release our own corpus. This dataset is a curated subset of the full dataset, which only includes English songs and retains only the highest-quality vocal performances. The labels exclusively use the default Arpabet phonemes. The voice provider is not a native English speaker, but their pronunciation is sufficiently competent. She is also not a professional singer, but the quality of the vocal performances remains acceptable. The total duration of the dataset is 1 hour and 45 minutes.

创建时间：

2024-09-15

原始信息汇总

Project AI❤dol Public English Dataset

概述

数据来源: 由Lotte V (或@lottev1991) 提供。
数据类型: 英语歌唱数据集。
数据质量:
- 语音提供者非英语母语者，但发音质量良好。
- 语音提供者非专业歌手，但歌唱质量尚可。
数据时长: 总时长为1小时45分钟。
标签格式: 使用默认的Arpabet音素标签。

使用条款

许可信息: 请参考LICENSE文件获取更多信息。
署名要求: 使用数据集时，请正确署名Lotte V (或@lottev1991)。
允许用途:
- 用于研究目的。
- 发布自定义标签，需提供正确署名。
- 用于个人歌唱数据的标签，可能需要手动调整，需提供正确署名。
- 用于个人SVS模型的音高训练，需提供正确署名。
限制用途:
- 仅限并行训练使用，不允许发布包含此语音的公共模型。
- 禁止与语音变声器（如RVC等）一起使用。
- 禁止用于任何商业项目。
- 禁止用于任何非法目的。
- 禁止用于训练未经授权的语音（如名人声音等）。

搜集汇总

数据集介绍

构建方式

在英语SVS数据严重匮乏的背景下，Project AI❤dol Public English Dataset应运而生。该数据集精选了由非英语母语女性演唱者录制的英语歌曲片段，确保了发音的准确性和歌唱质量的可接受性。所有标签均采用默认的Arpabet音标体系，以确保数据的标准化和一致性。数据集的总时长为1小时45分钟，旨在为研究者和开发者提供一个高质量的英语歌唱数据资源。

特点

Project AI❤dol Public English Dataset的显著特点在于其精选的高质量歌唱数据和标准化的音标标签。尽管演唱者并非英语母语者，但其发音足以满足大多数研究需求。此外，数据集的非商业性质和严格的用途限制，确保了其使用的合法性和道德性。这些特点使得该数据集在语音合成和歌唱模型训练领域具有独特的价值。

使用方法

使用Project AI❤dol Public English Dataset时，用户需遵循特定的使用条款。首先，用户应查阅LICENSE文件以获取详细的使用许可信息，并给予数据集创建者适当的归属。其次，该数据集允许用于研究目的，并可发布自定义标签，前提是提供适当的归属。此外，数据集可用于个人歌唱数据的标签调整和SVS模型的音高训练，但需注意可能需要手动调整标签。最后，数据集仅限于并行训练使用，禁止发布包含该声音的公共模型。

背景与挑战

背景概述

在人工智能语音合成（SVS）领域，公开可用的英语女性歌手数据集极为稀缺，这一现状严重制约了相关研究的进展。为填补这一空白，Lotte V（@lottev1991）于近期发布了一个精选的英语歌唱数据集，名为Project AI❤dol Public English Dataset。该数据集由非母语英语使用者提供，尽管其并非专业歌手，但其歌唱质量已达到可接受水平。此数据集的发布不仅为研究者提供了宝贵的资源，也为推动语音合成技术在多语言环境下的应用奠定了基础。

当前挑战

尽管Project AI❤dol Public English Dataset填补了英语女性歌手数据集的空白，但其构建过程中仍面临诸多挑战。首先，数据提供者并非母语英语使用者，这可能导致发音上的细微偏差，从而影响语音合成的准确性。其次，数据集的时长仅为1小时45分钟，相对较短，可能限制了模型的训练效果。此外，数据集仅包含默认的Arpabet音标标签，对于需要更精细标签的研究可能不够充分。最后，数据集的使用条款严格限制了其商业用途和模型发布，这可能限制了其在实际应用中的推广和影响力。

常用场景

经典使用场景

在语音合成系统（SVS）领域，Project AI❤dol Public English Dataset 因其独特的女性非母语英语演唱数据而备受关注。该数据集精选了高质量的英语歌曲演唱片段，特别适用于训练和优化基于Arpabet音标的语音合成模型。其独特之处在于，尽管演唱者并非专业歌手，但其发音质量足以满足学术研究和模型训练的需求。

实际应用

在实际应用中，Project AI❤dol Public English Dataset 可用于开发和测试语音合成系统，特别是在需要处理非母语英语发音的场景中。例如，它可以用于构建多语言支持的语音助手，或者在教育领域中用于开发语言学习工具。此外，该数据集还可用于音乐生成和编辑软件的开发，以增强其对不同发音风格的适应能力。

衍生相关工作

基于Project AI❤dol Public English Dataset，许多研究工作得以展开，特别是在语音合成和音乐生成领域。例如，有研究者利用该数据集开发了新的音标转换算法，以提高语音合成模型的准确性和自然度。此外，该数据集还激发了关于非母语发音处理的深入研究，推动了跨文化语音合成技术的发展。这些衍生工作不仅丰富了语音合成领域的研究内容，也为实际应用提供了技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集