Audiovision-MNIST
收藏DataCite Commons2025-01-02 更新2025-04-16 收录
下载链接:
https://service.tib.eu/ldmservice/dataset/e6723999-0321-4d73-bbea-9d0b34b32bfa
下载链接
链接失效反馈官方服务:
资源简介:
The Audiovision-MNIST dataset is a multi-modal dataset consisting of 1500 samples of audio and image files, with images for digits 0 to 9 and audio files with mel-frequency cepstral coefficients (MFCCs) for each digit.
视听-MNIST(Audiovision-MNIST)数据集是一个多模态数据集,包含1500组音图结合样本:其图像对应数字0至9,音频文件则均带有对应数字的梅尔频率倒谱系数(mel-frequency cepstral coefficients, MFCCs)。
提供机构:
TIB
创建时间:
2025-01-02
搜集汇总
背景与挑战
背景概述
Audiovision-MNIST是一个多模态数据集,包含1500个数字0-9的图像及对应音频文件(MFCC特征),适用于跨模态学习任务。
以上内容由遇见数据集搜集并总结生成



