Nexdata/11000_Image_Video_caption_data_of_human_action
收藏Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/11000_Image_Video_caption_data_of_human_action
下载链接
链接失效反馈官方服务:
资源简介:
20,000张图片和10,000个视频的人类行为描述数据集,涵盖了不同季节、不同拍摄角度、室内外场景。描述语言为英文和中文,主要描述人物的性别、年龄、衣着、行为描述和身体动作。数据集的准确率不低于97%。
20,000张图片和10,000个视频的人类行为描述数据集,涵盖了不同季节、不同拍摄角度、室内外场景。描述语言为英文和中文,主要描述人物的性别、年龄、衣着、行为描述和身体动作。数据集的准确率不低于97%。
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集内容
- 类型: 包含20,000张图像和10,000个视频的描述数据。
- 主题: 描述不同季节、不同拍摄角度下的各种人类行为,场景包括室内和室外。
- 描述细节: 主要描述性别、年龄、服装、行为描述及身体动作。
数据集特征
- 种族分布: 包括高加索人和黑人。
- 性别分布: 男性与女性。
- 年龄分布: 从青少年到老年,主要集中在青年和中年。
- 收集环境: 室内和室外场景。
- 收集多样性: 不同年龄组、不同收集环境、不同季节、多种拍摄角度及多种人类行为。
数据格式
- 图像格式: .jpg
- 视频格式: .mp4
- 文本格式: .txt
描述语言
- 主要语言: 英语和中文。
文本描述
- 长度: 原则上30~60字,通常3-5句。
- 主要内容: 性别、年龄、服装、行为描述、身体动作。
准确率
- 正确标注比例: 不低于97%。
许可信息
- 许可证: 商业许可证。



