five

Opendoc1-Analysis-Recognition

收藏
魔搭社区2025-12-03 更新2025-01-18 收录
下载链接:
https://modelscope.cn/datasets/prithivMLmods/Opendoc1-Analysis-Recognition
下载链接
链接失效反馈
官方服务:
资源简介:
# Opendoc1-Analysis-Recognition Dataset ## Overview The **Opendoc1-Analysis-Recognition** dataset is designed for tasks involving image-to-text, text classification, and image feature extraction. It contains images paired with class labels, making it suitable for vision-language tasks. ## Dataset Details - **Modalities**: Image - **Languages**: English - **Size**: Approximately 1,000 samples (n=1K) - **Tags**: image, analysis, vision-language - **License**: Apache 2.0 ## Tasks This dataset can be used for the following tasks: - **Image-to-Text**: Convert images into textual descriptions. - **Text Classification**: Classify text associated with images. - **Image Feature Extraction**: Extract features from images for further analysis. ## Dataset Structure The dataset is split into a training set with 232 rows. Each row contains: - **Image**: The image file. - **Label**: The class label associated with the image. ## Usage To use this dataset, you can download it from the Hugging Face Datasets Hub. The dataset files are approximately 443 MB in size, and the auto-converted Parquet files are around 464 MB. ## Download Information - **Size of downloaded dataset files**: 443 MB - **Size of the auto-converted Parquet files**: 464 MB - **Number of rows**: 386

# Opendoc1分析识别数据集(Opendoc1-Analysis-Recognition Dataset) ## 概览 本**Opendoc1分析识别数据集(Opendoc1-Analysis-Recognition Dataset)**专为图像转文本(Image-to-Text)、文本分类(Text Classification)以及图像特征提取(Image Feature Extraction)等任务设计。数据集包含与类别标签绑定的图像样本,适配各类视觉语言(vision-language)相关任务。 ## 数据集详情 - **模态**:图像 - **语言**:英语 - **样本量**:约1000条样本(标注为n=1K) - **标签**:图像、分析、视觉语言(vision-language) - **许可协议**:Apache 2.0 ## 适用任务 该数据集可用于以下任务: - **图像转文本(Image-to-Text)任务**:将图像转换为自然语言描述文本 - **文本分类(Text Classification)任务**:对与图像关联的文本进行分类 - **图像特征提取(Image Feature Extraction)任务**:从图像中提取特征以供后续分析使用 ## 数据集结构 该数据集划分为训练集,共包含232条数据。每条数据包含以下内容: - **图像**:图像文件 - **标签**:与该图像绑定的类别标签 ## 使用方式 如需使用该数据集,可从Hugging Face数据集中心下载。原始数据集文件大小约为443 MB,自动转换后的Parquet格式文件大小约为464 MB。 ## 下载信息 - **下载数据集文件大小**:443 MB - **自动转换后的Parquet格式文件大小**:464 MB - **数据行数**:386
提供机构:
maas
创建时间:
2025-01-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作