HuggingFaceM4/something_something_v2|视频内容分析数据集|机器学习数据集
收藏数据集概述
数据集名称
- 名称: Something Something v2
- 别名: Something-Something dataset (version 2)
数据集描述
- 摘要: Something Something v2 是一个包含220,847个标记视频片段的数据集,这些视频展示了人类执行预定义的基本动作,使用日常物品。该数据集旨在训练机器学习模型,以理解精细的人类手势,如将某物放入某物中,将某物倒置,以及用某物覆盖某物。
- 语言: 数据集的标注语言为英语。
数据集结构
- 数据实例: 每个数据实例包含视频ID、视频文件、文本描述、标签和占位符。
- 数据字段:
video_id
: 视频的唯一标识符。video
: 视频文件对象。placeholders
: 视频中出现的对象列表。text
: 视频中发生的事件描述。labels
: 视频中的动作标签,范围从0到173。
数据集创建
- 来源: 数据集为原创数据,由众包工作者提供视频和标签。
- 标注过程: 标签先于视频收集,由AMT工作者完成。
数据集使用考虑
- 社会影响: 该数据集对于动作识别预训练非常有用,因其包含多样化的动作。
- 许可证: 数据集的许可证为QualComm定义的一页文档,使用前需详细阅读。
引用信息
bibtex @inproceedings{goyal2017something, title={The" something something" video database for learning and evaluating visual common sense}, author={Goyal, Raghav and Ebrahimi Kahou, Samira and Michalski, Vincent and Materzynska, Joanna and Westphal, Susanne and Kim, Heuna and Haenel, Valentin and Fruend, Ingo and Yianilos, Peter and Mueller-Freitag, Moritz and others}, booktitle={Proceedings of the IEEE international conference on computer vision}, pages={5842--5850}, year={2017} }

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
人民日报语料库
该数据集包含2023年5月至2024年4月期间人民日报的全部文章,以JSON格式保存,每篇文章包含URL、标题和内容。
github 收录
Set5
Set5数据集是一个包含5张图像的图像超分辨率测试数据集,包括'baby', 'bird', 'butterfly', 'head', 'woman',通常用于评估图像超分辨率模型的性能。
huggingface 收录
Global Volcanism Program (GVP)
该数据集包含了全球火山活动的详细信息,包括火山的位置、类型、历史喷发记录、喷发频率等。数据集还提供了关于火山活动的研究报告和相关文献的链接。
volcano.si.edu 收录
微博与抖音评论数据集
数据集源自微博平台与抖音平台的评论信息,基于两个热点事件来对评论等信息进行爬取收集形成数据集。原数据一共3W5条,但消极评论与中立评论远远大于积极评论。因此作特殊处理后,积极数据2601条,消极数据2367条,中立数据2725条,共7693条数据。
github 收录