1aurent/unsplash-lite-palette|图像处理数据集|颜色分析数据集
收藏数据集概述
数据集信息
-
特征:
url
: 字符串类型ai_description
: 字符串类型palettes
: 结构体类型,包含以下子特征:1
: 2维数组,形状为[1, 3]
,数据类型为uint8
2
: 2维数组,形状为[2, 3]
,数据类型为uint8
3
: 2维数组,形状为[3, 3]
,数据类型为uint8
4
: 2维数组,形状为[4, 3]
,数据类型为uint8
5
: 2维数组,形状为[5, 3]
,数据类型为uint8
6
: 2维数组,形状为[6, 3]
,数据类型为uint8
7
: 2维数组,形状为[7, 3]
,数据类型为uint8
8
: 2维数组,形状为[8, 3]
,数据类型为uint8
-
分割:
train
: 包含 24998 个样本,占用 28536733 字节
-
下载大小: 4159745 字节
-
数据集大小: 28536733 字节
配置
- 配置名称:
default
- 数据文件:
train
: 路径为data/train-*
许可
- 许可类型:
other
- 许可名称:
unsplash-commercial
- 许可链接:
https://github.com/unsplash/datasets/blob/master/DOCS.md
任务类别
text-to-image
image-to-text
语言
en
标签
unsplash
v1.2.1
数据集名称
Unsplash Lite w/ Palettes
大小类别
10K<n<100K
来源数据集
1aurent/unsplash-lite
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
Amazon Reviews 2023
该数据集包含用户评论,如评分、评论文本、有用投票等,以及商品元数据,如产品描述、定价、图片等。数据集比以前的版本大245.2%,包含571.54M条评论,并具有更丰富的描述性商品特征和细粒度的时间戳。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
VQA
我们提出了自由形式和开放式视觉问答 (VQA) 的任务。给定图像和关于图像的自然语言问题,任务是提供准确的自然语言答案。反映许多现实世界的场景,例如帮助视障人士,问题和答案都是开放式的。视觉问题有选择地针对图像的不同区域,包括背景细节和底层上下文。因此,与生成通用图像说明的系统相比,在 VQA 上取得成功的系统通常需要对图像和复杂推理有更详细的理解。此外,VQA 适合自动评估,因为许多开放式答案仅包含几个单词或一组封闭的答案,可以以多项选择的形式提供。我们提供了一个数据集包含 100,000 的图像和问题并讨论它提供的信息。提供了许多 VQA 基线,并与人类表现进行了比较。
OpenDataLab 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录