Opendoc1-Analysis-Recognition
收藏魔搭社区2025-12-03 更新2025-01-18 收录
下载链接:
https://modelscope.cn/datasets/prithivMLmods/Opendoc1-Analysis-Recognition
下载链接
链接失效反馈官方服务:
资源简介:
# Opendoc1-Analysis-Recognition Dataset
## Overview
The **Opendoc1-Analysis-Recognition** dataset is designed for tasks involving image-to-text, text classification, and image feature extraction. It contains images paired with class labels, making it suitable for vision-language tasks.
## Dataset Details
- **Modalities**: Image
- **Languages**: English
- **Size**: Approximately 1,000 samples (n=1K)
- **Tags**: image, analysis, vision-language
- **License**: Apache 2.0
## Tasks
This dataset can be used for the following tasks:
- **Image-to-Text**: Convert images into textual descriptions.
- **Text Classification**: Classify text associated with images.
- **Image Feature Extraction**: Extract features from images for further analysis.
## Dataset Structure
The dataset is split into a training set with 232 rows. Each row contains:
- **Image**: The image file.
- **Label**: The class label associated with the image.
## Usage
To use this dataset, you can download it from the Hugging Face Datasets Hub. The dataset files are approximately 443 MB in size, and the auto-converted Parquet files are around 464 MB.
## Download Information
- **Size of downloaded dataset files**: 443 MB
- **Size of the auto-converted Parquet files**: 464 MB
- **Number of rows**: 386
# Opendoc1分析识别数据集(Opendoc1-Analysis-Recognition Dataset)
## 概览
本**Opendoc1分析识别数据集(Opendoc1-Analysis-Recognition Dataset)**专为图像转文本(Image-to-Text)、文本分类(Text Classification)以及图像特征提取(Image Feature Extraction)等任务设计。数据集包含与类别标签绑定的图像样本,适配各类视觉语言(vision-language)相关任务。
## 数据集详情
- **模态**:图像
- **语言**:英语
- **样本量**:约1000条样本(标注为n=1K)
- **标签**:图像、分析、视觉语言(vision-language)
- **许可协议**:Apache 2.0
## 适用任务
该数据集可用于以下任务:
- **图像转文本(Image-to-Text)任务**:将图像转换为自然语言描述文本
- **文本分类(Text Classification)任务**:对与图像关联的文本进行分类
- **图像特征提取(Image Feature Extraction)任务**:从图像中提取特征以供后续分析使用
## 数据集结构
该数据集划分为训练集,共包含232条数据。每条数据包含以下内容:
- **图像**:图像文件
- **标签**:与该图像绑定的类别标签
## 使用方式
如需使用该数据集,可从Hugging Face数据集中心下载。原始数据集文件大小约为443 MB,自动转换后的Parquet格式文件大小约为464 MB。
## 下载信息
- **下载数据集文件大小**:443 MB
- **自动转换后的Parquet格式文件大小**:464 MB
- **数据行数**:386
提供机构:
maas
创建时间:
2025-01-17



