VocalnetOpenDataset|歌声合成数据集|国风音乐数据集
收藏VocalnetOpenDataset 概述
数据集描述
- 类型: 中文歌声合成数据集
- 许可: 采用Creative Commons Attribution Share Alike 4.0 International协议,允许商业使用和再发布,但需对数据集进行署名。
音频特性
- 采样率: 32000Hz
- 位深度: 16bit
- 声道: 单声道
- 音质: 录音室级,已进行噪声门处理
- 组成: 每首歌曲可能包含多条音轨
数据集内容
- 主数据集:
- 包含多首完整或部分歌曲,具体数量未提供
- 曲风偏向国风,可能包含戏腔唱段
- 不提供歌词,需自行收集
- 零散数据集:
- 去除静音后的总时长未提供
- 已拼合为单个音频文件,可自行切割
- 内容可能重复,未经过人工处理
标注情况
- 已完成部分手工对齐和句子划分
- 使用Praat的TextGrid格式,未来将提供其他格式
- 标注工作正在进行中,欢迎志愿者贡献

Matchesfashion, Ltd. eCommerce insights
The eCommerce activity of Matchesfashion, Ltd. amounted to US$410m in 2023. Learn more about their online business including detailed eCommerce revenue analytics.
ecommercedb.com 收录
DOLPHINS
DOLPHINS数据集是由清华大学电子工程系创建的一个大规模、多场景、多视角、多模态的自动驾驶数据集。该数据集包含42376帧图像和点云数据,涵盖6种典型自动驾驶场景,如城市交叉口、T型路口等,并考虑了动态天气条件。数据集通过CARLA模拟器生成,确保了数据的多样性和真实性。DOLPHINS数据集旨在支持车辆间(V2V)和车辆与基础设施间(V2I)的协同感知研究,解决自动驾驶中的盲区和长距离感知问题,推动互联自动驾驶技术的发展。
arXiv 收录
TimeExtractor
该数据集由JioNLP创建,旨在微调大型语言模型(LLMs)以从文本中提取时间实体,并将其标准化为JSON格式。数据集分为两部分:general.json包含从各种新闻来源提取的样本,smartspeaker.json包含从语音助手获取的样本。提取过程首先从文本中提取原始时间实体字符串,然后通过大型模型进行标准化处理,最终结果可以输入到JioNLP的时间解析模块jio.parse中进行处理,以获得准确可靠的结果。数据集目前规模较小,未来可以通过添加各种类型的文本来扩展。
huggingface 收录
AerialMegaDepth
AerialMegaDepth数据集是由卡内基梅隆大学研究者创建的,该数据集结合了伪合成渲染和真实地面图像,旨在推进从地面和空中视角的图像中学习几何重建和视图合成任务。数据集通过将3D城市级网格的伪合成渲染与来自MegaDepth的真实地面级图像在统一坐标系中注册,包含了137个地标和132,137个地理注册图像。该数据集在具有挑战性的地面-空中场景中,显著提高了基于学习的方法在多视图几何预测和新型视图合成任务上的性能。
arXiv 收录
FishBase Species List
FishBase Species List 是一个包含全球鱼类物种信息的全面数据库。该数据集提供了关于鱼类物种的详细信息,包括物种名称、分类学信息、分布区域、生态习性、繁殖行为、食性等。此外,数据集还包括了每个物种的图片和参考文献,以便用户进行深入研究。
www.fishbase.se 收录