five

HowTo100M

收藏
arXiv2025-09-30 收录
下载链接:
https://www.di.ens.fr/willow/research/howto100m/
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为HowTo100M,是一个大规模的教学视频集合,其中包含了人类在日常活动中执行各种任务的短片段。尽管该数据集被用于预训练视频和语言模型(VLMs),但它并不包含机器人操作数据。作为一个大规模的数据集,其任务主要是用于预训练视频与语言结合的模型。

The dataset named HowTo100M is a large-scale collection of instructional videos, containing short video clips of humans performing diverse tasks during daily activities. Although this dataset has been utilized for pre-training Video-Language Models (VLMs), it does not include robotic manipulation data. As a large-scale dataset, its core application is the pre-training of video-language fusion models.
提供机构:
HowTo100M
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HowTo100M是一个大规模的教学视频数据集,包含1.36亿个带字幕的视频片段,源自120万个YouTube视频,涵盖23,000种不同领域的活动,如烹饪、手工艺、个人护理等。每个视频都配有从YouTube自动下载的字幕旁白。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作