Img2Text-Algorithm-Retrieval
收藏魔搭社区2025-12-03 更新2025-02-01 收录
下载链接:
https://modelscope.cn/datasets/prithivMLmods/Img2Text-Algorithm-Retrieval
下载链接
链接失效反馈官方服务:
资源简介:
# Img2Text-Algorithm-Retrieval Dataset
## Dataset Overview
The **Img2Text-Algorithm-Retrieval** dataset is designed for retrieving text descriptions of algorithms from corresponding images. This dataset consists of structured text, raw text, algorithm images, and metadata such as source URLs and filenames. It can be useful for tasks like **OCR-based text retrieval, image-to-text learning, and document understanding**.
## Dataset Details
- **Modality**: Image, Text
- **Format**: Parquet
- **Size**: ~33.8MB
- **Total Rows**: 300
## Features
| Column Name | Data Type | Description |
|-----------------|-----------|------------|
| **structure** | String | LaTeX or structured representation of the algorithm |
| **text** | String | Extracted textual representation of the algorithm |
| **image** | Image | Algorithm snapshot (from research papers) |
| **download_url**| String | URL of the source document |
| **instance_name** | String | Name of the instance (e.g., paper ID) |
## Usage
This dataset is useful for:
- **Algorithm text-image retrieval**: Matching textual algorithm descriptions to corresponding images.
- **OCR and text recognition**: Evaluating OCR models for structured text extraction.
- **Machine Learning research**: Training deep learning models for image-to-text conversion.
# Img2Text-Algorithm-Retrieval 数据集
## 数据集概览
**Img2Text-Algorithm-Retrieval 数据集** 专为从对应图像中检索算法的文本描述而构建。该数据集包含结构化文本、原始文本、算法图像以及元数据(如来源URL与文件名),可应用于基于光学字符识别(Optical Character Recognition)的文本检索、图像到文本学习以及文档理解等任务。
## 数据集详情
- **模态**:图像、文本
- **格式**:Parquet
- **大小**:约33.8MB
- **总条数**:300
## 特征
| 列名 | 数据类型 | 描述 |
|-------------|----------|------|
| **structure** | 字符串(String) | 算法的LaTeX或结构化表示形式 |
| **text** | 字符串(String) | 提取得到的算法文本表示形式 |
| **image** | 图像(Image) | 源自研究论文的算法快照 |
| **download_url**| 字符串(String) | 源文档的下载链接 |
| **instance_name** | 字符串(String) | 实例名称(如论文ID) |
## 应用场景
该数据集可用于以下方向:
- **算法图文检索**:将算法的文本描述与对应图像进行匹配。
- **光学字符识别(Optical Character Recognition)与文本识别**:评估用于结构化文本提取的OCR模型性能。
- **机器学习研究**:训练用于图像到文本转换的深度学习模型。
提供机构:
maas
创建时间:
2025-01-30



