imb-cls-mask-distilled-libri-one-sec-cv12/chunk_5|音频处理数据集|机器学习数据集
收藏数据集概述
特征
- audio:
- 数据类型: audio
- 采样率: 16000
- logits:
- 数据类型: float32
数据集划分
- train:
- 样本数量: 4221
- 数据大小: 135321566.67772558 字节
数据集大小
- 下载大小: 109647364 字节
- 数据集总大小: 135321566.67772558 字节
配置
- default:
- 数据文件路径: data/train-*
Chlamydophila psittaci (Lillie 1930) Everett et al. 1999
The range of data encompasses taxonomy, morphology, physiology, sampling and concomitant environmental conditions as well as molecular biology.
DataCite Commons 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
TCIA: The Cancer Imaging Archive
TCIA: The Cancer Imaging Archive 是一个公开的癌症影像数据库,包含多种癌症类型的影像数据,如乳腺癌、肺癌、脑癌等。数据集还包括相关的临床数据和生物标记物信息,旨在支持癌症研究和临床应用。
www.cancerimagingarchive.net 收录
Photovoltaic fault dataset
该数据集包含了一个并网光伏电站16天的运行数据,包括正常和故障状态。数据集分为两个.mat文件,可以使用MATLAB加载。数据涵盖了电压、电流、温度、辐照度和故障类别标签等信息。
github 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
