2K+ Hours of Face id Video Data | AI Training Data | Annotated Video for AI | Bounding Boxes, ...

Name: 2K+ Hours of Face id Video Data | AI Training Data | Annotated Video for AI | Bounding Boxes, ...
Creator: Data Seeds
License: 暂无描述

Databricks2026-01-27 收录

下载链接：

https://marketplace.databricks.com/details/aefc4c9a-97dd-468b-99b9-8e467bd19945/Data-Seeds_2K+-Hours-of-Face-id-Video-Data-AI-Training-Data-Annotated-Video-for-AI-Bounding-Boxes,-

下载链接

链接失效反馈

官方服务：

资源简介：

This dataset contains over 2,000 hours of face ID selfie video recordings captured worldwide. Designed for AI and machine-learning applications, it provides richly annotated, context-dense video data suitable for training vision-language models, action-recognition systems, identity-aware AI, and multimodal reasoning. Key Features 1. Comprehensive Video Annotation Layers Each video includes synchronized metadata across visual and audio channels, such as: Object annotations (bounding boxes, segmentation masks) Action labels and activity timelines Temporal event boundaries Transcripts for scenes containing speech Visual scene descriptions covering environment, objects, actions, and context Camera metadata (motion type, angle, field of view, lighting conditions) This supports training for identity-aware video analysis, activity detection, video captioning, tracking, VLM grounding, and multimodal understanding. 2. Unique Sourcing Capabilities Videos are collected through controlled contribution pipelines designed to generate authentic, unscripted real-world footage. This provides: Natural human movement and behavior Diverse environments and camera devices Continuous flow of fresh recordings Ability to generate custom datasets (e.g., specific actions, environments, lighting conditions, demographics, or motion patterns) 3. Global Visual & Cultural Diversity Contributors from 100+ countries supply: Indoor and outdoor recordings Urban, rural, and specialized environments Varied cultural behaviors, activities, and settings Multiple languages and speaking styles where speech is present This diversity ensures strong generalization for global identity-aware deployments. 4. High-Quality, Realistic Video Capture Data includes a wide range of visual conditions: 4K, HD, and consumer-grade recordings Static, handheld, and moving cameras Low-light, daylight, and variable lighting Clean vs. noisy audio channels Natural occlusions, motion blur, and complex backgrounds This supports robust performance in real-world face ID and video analysis systems. 5. AI-Ready Dataset Architecture Optimized for modern ML workflows, enabling: Face ID model training and evaluation Video classification and action recognition Vision-language model (VLM) alignment Multimodal reasoning and grounding Safety, moderation, and risk detection Tracking, segmentation, and object detection Compatible with leading ML frameworks and training pipelines. 6. Licensing & Compliance Fully compliant with global privacy standards Explicit contributor consent for face ID video usage Documented rights and usage permissions Vetted for commercial and research use Use Cases Face ID and identity-aware model training Vision-language model pretraining Multimodal AI for enterprise and consumer applications Safety, moderation, and fraud prevention Video retrieval, indexing, and summarization Research in identity recognition, activity analysis, and multimodal grounding

提供机构：

Data Seeds

5,000+

优质数据集

54 个

任务类型

进入经典数据集