terminusresearch/photo-architecture
收藏Hugging Face2024-06-29 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/terminusresearch/photo-architecture
下载链接
链接失效反馈官方服务:
资源简介:
Photo Architecture数据集主要包含建筑和独特建筑风格的图像,这些图像是从Pexels在2023年获取的。尽管某些建筑可能受版权保护,但用于训练通常被认为是合理使用。数据集中的图像文件名可以用作标题,或者使用parquet表中的相同值。此外,标题是由CogVLM创建的。
The Photo Architecture dataset was pulled from Pexels in 2023, containing a majority of images of buildings and unique architecture. Some images may be copyrighted, but training is currently understood to fall under fair-use. Image filenames can be used as captions, or the same values are available in the parquet table. The dataset includes full images, and captions were created with CogVLM.
提供机构:
terminusresearch
原始信息汇总
Photo Architecture Dataset
概述
- 数据集名称: Photo Architecture
- 数据来源: Pexels(2023年采集)
- 数据类型: 图像数据
- 主要内容: 建筑和独特建筑物的图像
- 数据格式: Parquet
- 数据文件:
- 文件名: architecture.parquet
- 分割: 训练集
数据特点
- 图像内容: 主要包含建筑和独特建筑物的图像
- 版权信息: 部分图像可能受版权保护,但训练用途被认为是合理使用
- 图像与文本配对: 图像文件名可用作描述,或从Parquet表格中获取相同值
- 描述生成: 使用CogVLM生成描述
配置
- 配置名称: default
- 数据文件路径: architecture.parquet
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个建筑主题的图像-文本对数据集,包含约4,357张从Pexels收集的建筑和独特建筑风格图像,总大小约20.1 GB。图像标题由CogVLM自动生成,适用于文本到图像任务,采用MIT许可证,但需注意部分图像可能存在版权问题。
以上内容由遇见数据集搜集并总结生成



