five

terminusresearch/photo-architecture

收藏
Hugging Face2024-06-29 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/terminusresearch/photo-architecture
下载链接
链接失效反馈
官方服务:
资源简介:
Photo Architecture数据集主要包含建筑和独特建筑风格的图像,这些图像是从Pexels在2023年获取的。尽管某些建筑可能受版权保护,但用于训练通常被认为是合理使用。数据集中的图像文件名可以用作标题,或者使用parquet表中的相同值。此外,标题是由CogVLM创建的。

The Photo Architecture dataset was pulled from Pexels in 2023, containing a majority of images of buildings and unique architecture. Some images may be copyrighted, but training is currently understood to fall under fair-use. Image filenames can be used as captions, or the same values are available in the parquet table. The dataset includes full images, and captions were created with CogVLM.
提供机构:
terminusresearch
原始信息汇总

Photo Architecture Dataset

概述

  • 数据集名称: Photo Architecture
  • 数据来源: Pexels(2023年采集)
  • 数据类型: 图像数据
  • 主要内容: 建筑和独特建筑物的图像
  • 数据格式: Parquet
  • 数据文件:
    • 文件名: architecture.parquet
    • 分割: 训练集

数据特点

  • 图像内容: 主要包含建筑和独特建筑物的图像
  • 版权信息: 部分图像可能受版权保护,但训练用途被认为是合理使用
  • 图像与文本配对: 图像文件名可用作描述,或从Parquet表格中获取相同值
  • 描述生成: 使用CogVLM生成描述

配置

  • 配置名称: default
  • 数据文件路径: architecture.parquet
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个建筑主题的图像-文本对数据集,包含约4,357张从Pexels收集的建筑和独特建筑风格图像,总大小约20.1 GB。图像标题由CogVLM自动生成,适用于文本到图像任务,采用MIT许可证,但需注意部分图像可能存在版权问题。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作