AVA-Dataset|视频分析数据集|动作识别数据集
收藏AVA-Dataset概述
数据集组成
- 视频数量: 192个视频,分为154个训练视频和38个测试视频。
- 标注时长: 每个视频有15分钟被标注,以3秒间隔进行,共300个标注段。
文件描述
-
标注文件: 包含两个CSV文件:
./ava_train_v1.0.csv
./ava_test_v1.0.csv
这些文件包含以下关键字段:video_id
: YouTube视频标识符。middle_frame_timestamp
: 视频开始后的中间帧时间戳(秒)。person_box(x1, y1, x2, y2)
: 人物框的坐标,左上角和右下角,坐标值归一化至帧大小。action_id
: 动作类别的标识符。status
: 视频可用状态。
-
动作列表文件:
./ava_action_list_v1.0.pbtxt
,定义了动作类别及其标识。
不可用视频列表
- 训练集: 包含多个视频ID,如
2XeFK-DTSZk
等。 - 测试集: 包含视频ID,如
XIx-C22Ewk4
等。
标签变更
- 训练集: 部分视频ID因问题被更改,如
-FaXLcSFjUI
更改为issue-FaXLcSFjUI
。

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录