LJSpeech|语音处理数据集|机器学习数据集
收藏AudioDatasetMaker
数据集创建过程概述
- 步骤1: 创建Deepgram转录JSON文件。
- 步骤2: 将转录JSON文件转换为带有时间戳的SRT文件。
- 步骤3: 使用SRT文件进行音频分段,同时尝试实现音频长度的高斯分布。
- 步骤4: 创建用于训练和评估的元数据文件。
数据集文件
- metadata_train.csv: 训练元数据文件。
- metadata_eval.csv: 评估元数据文件。
- 分段wav文件夹: 包含分段的音频文件。

- LJSpeech数据集首次发布,由Keith Ito和Rohit Prabhavalkar在GitHub上公开,旨在为语音合成研究提供一个标准化的数据集。
- LJSpeech数据集开始被广泛应用于各种语音合成模型的训练和评估,包括WaveNet、Tacotron等。
- LJSpeech数据集在多个国际会议和期刊上被引用,成为语音合成领域的一个重要基准数据集。
- 随着深度学习技术的发展,LJSpeech数据集的应用范围进一步扩大,涉及多语言语音合成和跨语言语音转换等研究方向。
- LJSpeech数据集的社区贡献开始增加,包括数据增强、预处理工具和模型优化等方面的改进。
- LJSpeech数据集在开源社区中的影响力持续增强,成为语音合成研究者和开发者的重要资源。
- 1LJ Speech: A Free, High-Quality Public Domain Speech DatasetKeith Ito · 2017年
- 2WaveGlow: A Flow-based Generative Network for Speech SynthesisNVIDIA · 2019年
- 3FastSpeech: Fast, Robust and Controllable Text to SpeechMicrosoft Research · 2019年
- 4MelGAN: Generative Adversarial Networks for Conditional Waveform SynthesisUniversity of California, Berkeley · 2019年
- 5HiFi-GAN: Generative Adversarial Networks for Efficient and High Fidelity Speech SynthesisNVIDIA · 2020年
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
熟肉制品在全国需求价格弹性分析数据
为更好了解各市对熟肉制品的市场需求情况,本行业所有企业对相关熟肉制品需求弹性数据进行采集计算。如果熟肉制品需求量变动的比率大于价格变动的比率,那么熟肉制品需求富有弹性,说明顾客对于熟肉制品价格变化的敏感程度大,弹性越大,需求对价格变化越敏感,本行业所有企业可以在该市适当的降低熟肉制品价格来获得较多的收益。如果熟肉制品需求缺乏弹性,本行业所有企业可以在该市适当的提高熟肉制品价格来获得较多的收益。该项数据对本行业所有企业在全国的市场营销决策有重要意义。1.数据采集:采集相关熟肉制品在某一时间段全国的的需求数据和价格数据,按照市级进行整理归纳,得到该熟肉制品的需求量变动数值和价格变化数值。 2.算法规则:对采集得到的数据按照如下公式进行计算:需求弹性系数Ed=-(△Q/Q)÷(△P/P),得到需求弹性系数。式中:Q表示产品的需求量,单位为份;P表示产品的价格,单位为元;△Q表示需求量同比变动值,单位为份;△P表示价格同比变动值,单位为元。取需求弹性系数的绝对值|Ed|作为分析数据时的参考系数。 3.数据分析:根据|Ed|的数值可分析该熟肉制品的需求价格弹性。(1)|Ed|=1(单位需求价格弹性),说明需求量变动幅度与价格变动幅度相同;(2)1<|Ed|(需求富有弹性),说明需求量变动幅度大于价格变动幅度;(3)|Ed|<1(需求缺乏弹性),说明需求量变动幅度小于价格变动幅度。
浙江省数据知识产权登记平台 收录