five

Nexdata/700_Thousand_Sets_Image_Caption_Data_Of_General_Scenes

收藏
Hugging Face2024-04-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/700_Thousand_Sets_Image_Caption_Data_Of_General_Scenes
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含1,000,000组图像和描述,图像类型涵盖风景、动物、花草树木、人物、汽车、运动、工业和建筑等,还包括一个美学子集。每张图像通常有至少两个描述,每个描述为一个句子,少数图像只有一个描述。描述语言为中文和英文。图像格式为.jpg,文本格式为.txt。描述内容主要涉及图像中的主要场景或一些显著特征。数据集的准确率不低于95%。

该数据集包含1,000,000组图像和描述,图像类型涵盖风景、动物、花草树木、人物、汽车、运动、工业和建筑等,还包括一个美学子集。每张图像通常有至少两个描述,每个描述为一个句子,少数图像只有一个描述。描述语言为中文和英文。图像格式为.jpg,文本格式为.txt。描述内容主要涉及图像中的主要场景或一些显著特征。数据集的准确率不低于95%。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集内容

  • 图像与描述数量:1,000,000套图像及描述
  • 图像类型:涵盖风景、动物、花卉与树木、人物、车辆、体育、工业和建筑,以及美学子集
  • 描述语言:中文、英文

数据集详情

  • 数据格式:图像格式为.jpg,文本格式为.txt
  • 文本长度:原则上,单句描述长度为5-20字符,每张图片至少包含两种描述,每种描述一句;少数图片只有一种描述
  • 主要描述内容:图像中的主要场景或显著特征
  • 准确率:正确标注的图像比例不低于95%

许可信息

  • 许可证:商业许可证
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作