1aurent/unsplash-lite-palette|图像处理数据集|颜色分析数据集

hugging_face2024-04-17 更新2024-03-04 收录

图像处理

颜色分析

下载链接：

https://hf-mirror.com/datasets/1aurent/unsplash-lite-palette

下载链接

链接失效反馈

资源简介：

Unsplash Lite数据集包含约25,000张照片的URL、AI生成的描述以及8种颜色调色板。该数据集可用于商业和非商业用途，但需遵守特定条款。数据集主要用于研究目的，不能用于重新分发图像。此外，文件还提供了如何从URL下载图像的示例代码。

提供机构：

1aurent

原始信息汇总

数据集概述

数据集信息

特征:
- url: 字符串类型
- ai_description: 字符串类型
- palettes: 结构体类型，包含以下子特征:
  - 1: 2维数组，形状为 [1, 3]，数据类型为 uint8
  - 2: 2维数组，形状为 [2, 3]，数据类型为 uint8
  - 3: 2维数组，形状为 [3, 3]，数据类型为 uint8
  - 4: 2维数组，形状为 [4, 3]，数据类型为 uint8
  - 5: 2维数组，形状为 [5, 3]，数据类型为 uint8
  - 6: 2维数组，形状为 [6, 3]，数据类型为 uint8
  - 7: 2维数组，形状为 [7, 3]，数据类型为 uint8
  - 8: 2维数组，形状为 [8, 3]，数据类型为 uint8
分割:
- train: 包含 24998 个样本，占用 28536733 字节
下载大小: 4159745 字节
数据集大小: 28536733 字节

配置

配置名称: default
数据文件:
- train: 路径为 data/train-*

许可

许可类型: other
许可名称: unsplash-commercial
许可链接: https://github.com/unsplash/datasets/blob/master/DOCS.md

任务类别

text-to-image
image-to-text

语言

en

数据集名称

Unsplash Lite w/ Palettes

大小类别

10K<n<100K

来源数据集

1aurent/unsplash-lite

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

MedDialog

MedDialog数据集（中文）包含了医生和患者之间的对话（中文）。它有110万个对话和400万个话语。数据还在不断增长，会有更多的对话加入。原始对话来自好大夫网。

github 收录

Amazon Reviews 2023

该数据集包含用户评论，如评分、评论文本、有用投票等，以及商品元数据，如产品描述、定价、图片等。数据集比以前的版本大245.2%，包含571.54M条评论，并具有更丰富的描述性商品特征和细粒度的时间戳。

github 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据，包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情，支持职业规划和薪资谈判。

www.linkedin.com 收录

VQA

我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题，任务是提供准确的自然语言答案。反映许多现实世界的场景，例如帮助视障人士，问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域，包括背景细节和底层上下文。因此，与生成通用图像说明的系统相比，在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外，VQA 适合自动评估，因为许多开放式答案仅包含几个单词或一组封闭的答案，可以以多项选择的形式提供。我们提供了一个数据集包含 100，000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线，并与人类表现进行了比较。

OpenDataLab 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集，旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段，涵盖超过70种不同的复杂背景，确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向，通过收集大量真实场景下的手语视频材料，覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域，旨在提高手语识别技术在复杂环境中的准确性和效率，促进聋人与听人社区之间的无障碍沟通。

arXiv 收录