five

Audiovision-MNIST

收藏
DataCite Commons2025-01-02 更新2025-04-16 收录
下载链接:
https://service.tib.eu/ldmservice/dataset/e6723999-0321-4d73-bbea-9d0b34b32bfa
下载链接
链接失效反馈
官方服务:
资源简介:
The Audiovision-MNIST dataset is a multi-modal dataset consisting of 1500 samples of audio and image files, with images for digits 0 to 9 and audio files with mel-frequency cepstral coefficients (MFCCs) for each digit.

视听-MNIST(Audiovision-MNIST)数据集是一个多模态数据集,包含1500组音图结合样本:其图像对应数字0至9,音频文件则均带有对应数字的梅尔频率倒谱系数(mel-frequency cepstral coefficients, MFCCs)。
提供机构:
TIB
创建时间:
2025-01-02
搜集汇总
背景与挑战
背景概述
Audiovision-MNIST是一个多模态数据集,包含1500个数字0-9的图像及对应音频文件(MFCC特征),适用于跨模态学习任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作