Timdb/AE4317-cyberzoo-tudelft|无人机数据集|图像识别数据集
收藏数据集概述
数据集信息
- 大小分类: 10K<n<100K
- 数据集大小: 622057858.415 字节
- 下载大小: 618329781 字节
特征
- image: 图像类型
- left: 整数类型
- forward: 整数类型
- right: 整数类型
分割
- 训练集:
- 示例数量: 12489
- 字节数: 561073580.031
- 测试集:
- 示例数量: 1388
- 字节数: 60984278.384
配置
- 默认配置:
- 训练集路径: data/train-*
- 测试集路径: data/test-*
数据集结构
- 训练集占比: 90%
- 测试集占比: 10%
- 标签: "left", "forward", "right"

UAVDT
UAVDT是一个用于目标检测任务的数据集。
github 收录
lmarena-ai/arena-human-preference-100k
这个数据集包含了2024年6月至2024年8月期间收集的排行榜对话数据。它包括用于开发Arena Explorer的英语人类偏好评价。此外,我们还提供了一个嵌入文件,其中包含了英语对话的预计算嵌入,这些嵌入用于主题建模管道以对这些对话进行分类和分析。
hugging_face 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
Nexdata/chinese_dialect
该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。
hugging_face 收录
GTEx (Genotype-Tissue Expression)
GTEx数据集包含了来自多个组织和器官的基因表达数据,旨在研究基因型与组织特异性表达之间的关系。数据集包括基因表达谱、基因型信息、组织样本的详细描述等。
gtexportal.org 收录