TripleSumm-Mr.HiSum
收藏Hugging Face2026-03-15 更新2026-03-16 收录
下载链接:
https://huggingface.co/datasets/hminjeong/TripleSumm-Mr.HiSum
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是对原始MR.HiSum数据集的重构版本,旨在支持多模态视频摘要研究。原始数据集为单模态,仅提供预提取特征,而重构后的数据集通过独立爬取原始视频并提取三种不同模态的特征(视觉、音频和文本)来增强其多模态研究能力。数据集包含30,452个视频的元数据、预提取的多模态特征(视觉特征使用InceptionV3提取,音频特征使用Audio Spectrogram Transformer提取,文本特征使用RoBERTa提取)、地面真实标注和标准化的训练、验证及测试集划分。需要注意的是,由于部分YouTube视频可能已被删除或设为私有,视频总数和具体统计可能与原始研究略有差异。数据集适用于视频摘要任务,特别是多模态融合方法的研究。
创建时间:
2026-03-11



