five

malaysia-ai/malay-conversational-speech-corpus|语音识别数据集|马来语数据集

收藏
hugging_face2023-12-13 更新2024-03-04 收录
语音识别
马来语
下载链接:
https://hf-mirror.com/datasets/malaysia-ai/malay-conversational-speech-corpus
下载链接
链接失效反馈
资源简介:
该数据集名为malay-conversational-speech-corpus,是一个马来语对话语音语料库。数据集包含的特征有Y、id、gender和filename,其中filename特征包含音频数据,采样率为16000Hz。数据集分为一个训练集,包含3241个样本,总大小为48785004.736字节。数据集的下载大小为47709555字节,语言为马来语(ms)。数据集的许可证为Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License。

该数据集名为malay-conversational-speech-corpus,是一个马来语对话语音语料库。数据集包含的特征有Y、id、gender和filename,其中filename特征包含音频数据,采样率为16000Hz。数据集分为一个训练集,包含3241个样本,总大小为48785004.736字节。数据集的下载大小为47709555字节,语言为马来语(ms)。数据集的许可证为Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License。
提供机构:
malaysia-ai
原始信息汇总

马来语会话语音语料库

数据集信息

特征

  • Y: 字符串类型
  • id: 字符串类型
  • gender: 字符串类型
  • filename:
    • audio:
      • sampling_rate: 16000

分割

  • train:
    • num_bytes: 48785004.736
    • num_examples: 3241

大小

  • download_size: 47709555
  • dataset_size: 48785004.736

语言

  • ms
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

FSDD

FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。

github.com 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

ISIC 2019

ISIC 2019数据集包含25,331张皮肤病变图像,用于皮肤癌检测挑战。这些图像分为三个类别:良性、恶性黑色素瘤和基底细胞癌。数据集还包括每张图像的元数据,如病变类型、患者年龄和性别等。

challenge2019.isic-archive.com 收录