C2KD
收藏Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/Duckduck007/C2KD
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由三个多模态数据集组成:CREMA-D(情感识别音频-视频数据集)、AVE(视听事件数据集)和 VGGSound(大规模视频-音频数据集)。原始数据为视频格式,需预处理为RGB图像帧和音频波形文件。这些数据集适用于跨模态知识蒸馏任务,旨在通过模态间知识迁移提升模型性能。数据预处理代码位于项目目录的utils/data/下。
创建时间:
2026-03-22



