StofEzz/eldery_c_voice|老年人数据集|语音识别数据集
收藏数据集概述
配置
- 默认配置 (
default
)- 数据文件路径:
- 训练集 (
train
):data/train-*
- 测试集 (
test
):data/test-*
- 验证集 (
validation
):data/validation-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征:
path
: 字符串类型audio
: 音频类型,采样率为 48000 Hzsentence
: 字符串类型
-
数据分割:
- 训练集 (
train
):- 字节数: 88033443.40449926
- 样本数: 2000
- 测试集 (
test
):- 字节数: 4627968.430121169
- 样本数: 100
- 验证集 (
validation
):- 字节数: 4832561.977288587
- 样本数: 100
- 训练集 (
-
数据集大小:
- 下载大小: 88167442 字节
- 数据集大小: 97493973.81190902 字节

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录