UQ Awaz Ambiri|文本到语音转换数据集|Uyghur语言数据集
收藏UQ Awaz Ambiri 数据集概述
数据集内容
- 数据集名称:UQ Awaz Ambiri
- 数据集目的:用于深度学习技术支持的维吾尔语语音合成(Text To Speech)研究,旨在消除维吾尔语语音中的不清晰问题。
- 数据来源:由Exmed Pida’iy朗读,Merhum Muhemmed Sali Damolla翻译的维吾尔语《古兰经》语音。
- 数据集规模:包含16187个语音文件,每个语音文件最长10秒,总时长约28小时。
数据结构
- 语音文件:以16位PCM WAV格式存储,采样率为22050 Hz。
- 元数据:存储于
metadata.csv
文件中,采用UTF-8编码,每个记录包含四个部分:- 第一部分:语音文件的唯一标识,与
.wav
文件名对应。 - 第二部分:使用维吾尔阿拉伯字母(UEY)的文本。
- 第三部分:使用维吾尔拉丁字母(ULY)的文本。
- 第四部分:使用维吾尔斯拉夫字母(USY)的文本。
- 第一部分:语音文件的唯一标识,与
数据集使用
- 数据集可用于语音与文本的对齐研究,通过程序将《古兰经》的语音部分分割成不超过10秒的片段,并与相应的维吾尔语文本对齐。
- 数据集的文本部分提供了维吾尔阿拉伯字母、维吾尔拉丁字母和维吾尔斯拉夫字母三种形式的文本,方便研究者使用。
数据集下载
- 数据集大小为2.9 GB,以7z格式压缩,可通过以下链接下载:

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
RFUAV
RFUAV数据集是由浙江科技大学信息科学与工程学院开发的高质量原始射频数据集,包含37种不同无人机的约1.3 TB原始频率数据。该数据集旨在解决现有无人机检测数据集类型单一、数据量不足、信号-to-噪声比(SNR)范围有限等问题,提供了丰富的SNR级别和用于特征提取的基准预处理方法及模型评估工具。数据集适用于射频无人机检测和识别,有助于推动相关技术的研究与应用。
arXiv 收录
中国1km分辨率逐月平均气温数据集(1901-2024)
该数据为中国逐月平均温度数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。数据单位为0.1 ℃。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录
TCIA: The Cancer Imaging Archive
TCIA: The Cancer Imaging Archive 是一个公开的癌症影像数据库,包含多种癌症类型的影像数据,如乳腺癌、肺癌、脑癌等。数据集还包括相关的临床数据和生物标记物信息,旨在支持癌症研究和临床应用。
www.cancerimagingarchive.net 收录