Seenka/solo_vgs
收藏Hugging Face2023-07-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Seenka/solo_vgs
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: image
dtype: image
- name: label
dtype:
class_label:
names:
'0': none
'1': videograph
'2': zocalo
- name: yolo_out
list:
- name: class
dtype: int64
- name: confidence
dtype: float64
- name: name
dtype: string
- name: xmax
dtype: float64
- name: xmin
dtype: float64
- name: ymax
dtype: float64
- name: ymin
dtype: float64
- name: cropped_image
dtype: image
- name: ocr_out
list:
- name: bbox
sequence:
sequence: float64
- name: confidence
dtype: float64
- name: text
dtype: string
- name: embeddings
sequence: float32
- name: embeddings_cropped
sequence: float32
- name: yolo_seenka_out
list:
- name: class
dtype: int64
- name: confidence
dtype: float64
- name: name
dtype: string
- name: xmax
dtype: float64
- name: xmin
dtype: float64
- name: ymax
dtype: float64
- name: ymin
dtype: float64
- name: yolo_filter_order
dtype: int64
splits:
- name: train
num_bytes: 88610046.92696348
num_examples: 599
- name: test
num_bytes: 23650123.743467934
num_examples: 149
download_size: 91354060
dataset_size: 112260170.6704314
---
# Dataset Card for "solo_vgs"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征项:
1. 名称:图像(image),数据类型:图像(image)
2. 名称:标签(label),数据类型:类别标签(class_label),类别映射如下:
'0':无(none)
'1':视频影像(videograph)
'2':柱基(zocalo)
3. 名称:YOLO(You Only Look Once)输出(yolo_out),为列表类型,包含以下字段:
- 类别(class):数据类型为int64
- 置信度(confidence):数据类型为float64
- 名称(name):数据类型为字符串
- X轴最大值(xmax):数据类型为float64
- X轴最小值(xmin):数据类型为float64
- Y轴最大值(ymax):数据类型为float64
- Y轴最小值(ymin):数据类型为float64
4. 名称:裁剪图像(cropped_image),数据类型:图像
5. 名称:OCR(Optical Character Recognition)输出(ocr_out),为列表类型,包含以下字段:
- 边界框(bbox):二维float64序列
- 置信度(confidence):数据类型为float64
- 文本(text):数据类型为字符串
6. 名称:嵌入向量(embeddings):float32序列
7. 名称:裁剪图像嵌入向量(embeddings_cropped):float32序列
8. 名称:YOLO(You Only Look Once)seenka输出(yolo_seenka_out),为列表类型,包含以下字段:
- 类别(class):数据类型为int64
- 置信度(confidence):数据类型为float64
- 名称(name):数据类型为字符串
- X轴最大值(xmax):数据类型为float64
- X轴最小值(xmin):数据类型为float64
- Y轴最大值(ymax):数据类型为float64
- Y轴最小值(ymin):数据类型为float64
9. 名称:YOLO过滤顺序(yolo_filter_order):数据类型为int64
数据集划分:
1. 训练集(train):字节数为88610046.92696348,样本数量为599
2. 测试集(test):字节数为23650123.743467934,样本数量为149
下载总大小:91354060 字节
数据集总占用大小:112260170.6704314 字节
# "solo_vgs"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Seenka
原始信息汇总
数据集概述
数据集特征
- image:图像数据类型。
- label:分类标签,包含以下类别:
- 0: none
- 1: videograph
- 2: zocalo
- yolo_out:包含以下子特征:
- class:整数类型。
- confidence:浮点数类型。
- name:字符串类型。
- xmax, xmin, ymax, ymin:均为浮点数类型。
- cropped_image:图像数据类型。
- ocr_out:包含以下子特征:
- bbox:浮点数序列。
- confidence:浮点数类型。
- text:字符串类型。
- embeddings:浮点数序列。
- embeddings_cropped:浮点数序列。
- yolo_seenka_out:包含以下子特征:
- class:整数类型。
- confidence:浮点数类型。
- name:字符串类型。
- xmax, xmin, ymax, ymin:均为浮点数类型。
- yolo_filter_order:整数类型。
数据集分割
- train:包含599个样本,总大小为88610046.92696348字节。
- test:包含149个样本,总大小为23650123.743467934字节。
数据集大小
- 下载大小:91354060字节。
- 数据集总大小:112260170.6704314字节。



