five

VideoMMMU|教育视频数据集|知识提取数据集

收藏
github2025-01-22 更新2025-02-10 收录
教育视频
知识提取
下载链接:
https://github.com/EvolvingLMMs-Lab/VideoMMMU
下载链接
链接失效反馈
资源简介:
VideoMMMU是一个大规模、多模态、多学科的视频基准数据集,用于评估从教育视频中获取知识的能力。

VideoMMMU is a large-scale, multimodal, multidisciplinary video benchmark dataset designed for evaluating the capability of extracting knowledge from educational videos.
创建时间:
2025-01-22
原始信息汇总

Video-MMMU 数据集概述

数据集简介

Video-MMMU 是首个评估从教育视频中获取知识能力的多模态、多学科视频基准测试,旨在评估大型多模态模型(LMMs)从教育视频中学习新知识并应用于实践的能力。

数据集特点

1. 视频内容

  • 视频数量:300 个讲座风格视频
  • 覆盖学科:6 个专业领域(艺术、商业、科学、医学、人文、工程)
  • 子学科数量:30 个

2. 问题设计

  • 问题数量:900 个问答对(每个视频 3 个问答对)
  • 认知层次
    • 感知:识别关键信息
    • 理解:理解基本概念
    • 适应:将知识应用于新场景

3. 评估指标

  • Δknowledge 指标:量化模型从视频中学习后的性能提升 math Delta_{ ext{knowledge}} = frac{ ext{Acc}{ ext{after_video}} - ext{Acc}{ ext{before_video}}}{100% - ext{Acc}_{ ext{before_video}}} imes 100%

评估方法

  • 评估框架:集成于 LMMs-Eval
  • 评估任务
    • 整体评估(video_mmmu)
    • 单轨道评估(感知、理解、适应)
    • 知识获取实验(question_only 轨道)

数据集使用

  • 安装: bash pip install lmms-eval

  • 评估示例: bash accelerate launch --num_processes=1 --main_process_port 12345 -m lmms_eval --model llava_onevision --model_args pretrained=lmms-lab/llava-onevision-qwen2-7b-ov,conv_template=qwen_1_5,model_name=llava_qwen,max_frames_num=32,torch_dype=bfloat16 --tasks video_mmmu --batch_size 1 --log_samples --log_samples_suffix debug --output_path ./logs/

引用

shell @article{hu2025videommmu, title={Video-MMMU: Evaluating Knowledge Acquisition from Multi-Discipline Professional Videos}, author={Kairui Hu and Penghao Wu and Fanyi Pu and Wang Xiao and Yuanhan Zhang and Xiang Yue and Bo Li and Ziwei Liu}, booktitle={arXiv preprint arXiv:2501.13826}, year={2025}, url={https://arxiv.org/abs/2501.13826} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
VideoMMMU数据集的构建采用了跨学科专业视频的大规模整合,通过严格筛选和标注,形成了一个多模态、多学科的视频评估基准。该数据集旨在评价模型从教育视频中进行知识获取的能力,涵盖了不同领域的专业知识视频,为模型提供了丰富的学习材料和学习场景。
使用方法
使用VideoMMMU数据集时,用户需先签署许可协议,以获得使用权限。安装lmms-eval包后,用户可以通过命令行工具对数据集进行评估,支持多种评估任务和模型。数据集的使用方法详细说明了如何加载和运行评估,同时提供了不同模型的性能基准,有助于研究者快速上手和对比分析。
背景与挑战
背景概述
Video-MMMU数据集,创建于2025年,由LMMs-Lab团队推出,是一个大规模的多模态、跨学科视频基准数据集。该数据集旨在评估从教育视频中获取知识的能力。Video-MMMU数据集的构建,汇聚了多个学科的专业视频资源,为多模态知识获取的研究提供了重要的实验平台。该数据集的发布,对教育视频领域的知识获取研究产生了显著影响,推动了相关技术的发展和应用。
当前挑战
Video-MMMU数据集在构建过程中面临的挑战主要包括:1) 多学科视频资源的整合与标注,确保视频内容的专业性和多样性;2) 多模态信息的有效融合与处理,以适应不同模态间的信息互补;3) 知识获取能力的精确评估,需要设计合理的评价指标和测试协议;4) 数据集的版权和使用许可问题,确保数据集的合法合规使用。
常用场景
经典使用场景
Video-MMMU数据集作为评估多学科专业视频知识获取能力的基准,其经典使用场景主要在于对教育视频中的知识获取能力进行量化评估,通过对多模态、多学科的视频内容进行分析,从而评价模型在理解、感知及适应不同学科知识上的表现。
解决学术问题
该数据集解决了多学科知识融合与评估的难题,为学术研究提供了关于视频内容知识获取的量化标准,有助于促进多模态学习模型在视频理解、知识提取和教育领域的应用发展。
实际应用
在实际应用中,Video-MMMU数据集可用于教育平台的知识评估系统,辅助教师评估学生的学习效果,或用于开发智能教育助手,提供个性化的学习建议。
数据集最近研究
最新研究方向
VideoMMMU数据集是一项旨在评估从多学科专业视频中获取知识能力的大型多模态多学科视频基准。该数据集的发布,为知识获取领域带来了新的研究方向,即如何通过视频媒体高效地获取和评估专业知识。近期研究聚焦于利用VideoMMMU进行多模态学习模型的训练与评估,以期提升模型在理解教育视频内容、获取视频中蕴含的跨学科知识方面的性能。此外,研究者们也在探索如何通过该数据集优化模型在知识适应性和迁移性上的表现,这对于构建能够适应不同学科背景、具备更强知识泛化能力的人工智能系统具有重要意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国高考录取分数线数据

  高考录取分数线,是指普通高等学校招生全国统一考试录取分数线。该分数线,每年高考结束后,由省级教育招生主管部门统计后公布。高考录取分数线分为本科线和专科线。全国各个地方的录取线分科类、分批次确定,科类一般分为文科类、理科类、音乐类(文、理)、美术类(文、理)、体育类等,每一科类又各分为提前批、第一批、第二批等等。  CnOpenData推出中国高考录取分数线数据,从批次、学校、专业等三方面汇总高考录取情况,涵盖生源地、学校所在地、年份、分类、批次、分科、分数线、学校、专业、录取人数、最高/低分等字段,为相关研究提供优质的数据资源。

CnOpenData 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录