alfredplpl/commoncatalog-cc-by-recap
收藏Hugging Face2024-06-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/alfredplpl/commoncatalog-cc-by-recap
下载链接
链接失效反馈官方服务:
资源简介:
CommonCatalog CC-BY Recaptioning数据集是对CommonCatalog CC-BY的扩展,添加了由Phi-3 Vision生成的英语密集描述(Dense Captioning)。数据集的主键是photoid,可以与CommonCatalog CC-BY结合使用。使用streaming=True可以按顺序加载数据。
CommonCatalog CC-BY Recaptioning数据集是对CommonCatalog CC-BY的扩展,添加了由Phi-3 Vision生成的英语密集描述(Dense Captioning)。数据集的主键是photoid,可以与CommonCatalog CC-BY结合使用。使用streaming=True可以按顺序加载数据。
提供机构:
alfredplpl
原始信息汇总
数据集概述
数据集名称
- CommonCatalog CC-BY Recaptioning
数据集许可证
- CC-BY-4.0
任务类别
- image-to-text
- text-to-image
语言
- 英语(en)
数据集大小
- 100K<n<1M
数据集内容
- 包含由Phi-3 Vision进行Dense Captioning的英语描述。
- 主键为photoid,建议与CommonCatalog CC-BY结合使用。
- 支持streaming=True模式,以相同顺序加载数据。
样本代码
- 提供了使用Python加载和处理数据的示例代码,包括读取CSV文件、加载数据集、保存图像和生成数据信息JSON文件的步骤。
发布记录
- 2024/06/08: 发布250k版本。
- 2024/06/06: 发布200k版本。
- 2024/06/02: 发布150k版本。
- 2024/05/30: 发布100k版本。
- 2024/05/27: 发布50k版本。
- 2024/05/26: 发布30k版本。



