Global Land Surface Evaporation: the Amsterdam Methodology (GLEAM) Data|气候变化数据集|水循环数据集
收藏
- GLEAM数据集的初步概念由荷兰阿姆斯特丹自由大学的Marta Yebra博士提出,旨在通过卫星数据估算全球陆地表面的蒸发量。
- GLEAM数据集的第一个版本(GLEAM v1)正式发布,该版本基于MODIS卫星数据,提供了全球范围内的蒸发量估算。
- GLEAM数据集的第二个版本(GLEAM v2)发布,引入了更多的卫星数据源,如SEVIRI和AMSR-E,提高了蒸发量估算的精度和覆盖范围。
- GLEAM数据集的第三个版本(GLEAM v3)发布,进一步优化了算法,增加了对地表能量平衡各分量的估算,并扩展了数据的时间覆盖范围。
- GLEAM数据集的最新版本(GLEAM v3.5)发布,引入了新的卫星数据源和改进的算法,提供了更高分辨率和更精确的蒸发量估算。
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录