FineVideo|多媒体理解数据集|视频问答数据集
收藏FineVideo 数据集概述
数据集简介
- 名称: FineVideo
- 视频数量: 43,000+
- 时长: 3,400+ 小时
- 标注内容:
- 丰富描述
- 叙事细节
- 场景分割
- QA 对
数据集内容
- 数据集创建流程:
- 视频收集:
- 脚本:
filter-yt-commons.py
- Docker 容器:
ytdlps3
- 脚本:
- 动态过滤:
- Docker 容器:
videodynamismfiltering
- 脚本:
worddensityfiltering.py
- Docker 容器:
- 视频分类:
- 脚本:
create_prompts.py
,tgi_inference_client.py
- 配置文件:
content_taxonomy.json
- 脚本:
- 内容选择:
- 配置文件:
content_taxonomy.json
- 脚本:
oracle.py
- 配置文件:
- 内容标注:
- 脚本:
video2annotation.py
- 提示文件:
gemini_prompt.txt
- 脚本:
- 视频对齐:
- 脚本:
video_alignment.py
- 脚本:
- 视频收集:
技术细节
- 可扩展性:
- 使用 Docker 容器实现分布式处理
- 支持多实例并行处理

LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
Coffee_Shop_Sales
该数据集包含了咖啡店的详细交易信息,包括交易ID、日期、时间、店铺编号、位置、产品类别、类型、名称、价格、月份、日期、星期和小时等属性。数据集用于分析咖啡店的销售情况,如收入和交易量的变化趋势。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录