five

Img2Text-Plaintext-Retrieval

收藏
魔搭社区2025-12-03 更新2025-04-26 收录
下载链接:
https://modelscope.cn/datasets/prithivMLmods/Img2Text-Plaintext-Retrieval
下载链接
链接失效反馈
官方服务:
资源简介:
# **Img2Text-Plaintext-Retrieval Dataset** ## **Dataset Overview** The **Img2Text-Plaintext-Retrieval** dataset is designed for retrieving plaintext descriptions from corresponding algorithm images. This dataset consists of structured text, raw text, algorithm images, and metadata such as source URLs and filenames. It is suitable for tasks like **OCR-based text retrieval, image-to-text learning, and document understanding**. ## **Dataset Details** - **Modality**: Image, Text - **Format**: Parquet - **Size**: ~456MB - **Total Rows**: 4,471 ## **Features** | Column Name | Data Type | Description | |-----------------|-----------|------------| | **structure** | String | LaTeX or structured representation of the algorithm | | **text** | String | Extracted textual representation of the algorithm | | **image** | Image | Algorithm snapshot (from research papers) | | **download_url**| String | URL of the source document | | **instance_name** | String | Name of the instance (e.g., paper ID) | ## **Usage** This dataset is useful for: - **Algorithm text-image retrieval**: Matching textual algorithm descriptions to corresponding images. - **OCR and text recognition**: Evaluating OCR models for structured text extraction. - **Machine Learning research**: Training deep learning models for image-to-text conversion.

# **Img2Text-Plaintext-Retrieval 数据集** ## **数据集概述** **Img2Text-Plaintext-Retrieval** 数据集旨在实现从对应算法图像中检索纯文本描述。该数据集包含结构化文本、原始文本、算法图像以及来源URL、文件名等元数据,适用于**基于光学字符识别(Optical Character Recognition,OCR)的文本检索、图像到文本学习、文档理解**等任务。 ## **数据集详情** - **模态**:图像、文本 - **格式**:Parquet - **大小**:约456MB - **总样本数**:4471行 ## **特征列** | 列名 | 数据类型 | 描述 | |------------------|----------|--------------------------| | **structure** | String | 算法的LaTeX或结构化表示 | | **text** | String | 提取得到的算法文本表示 | | **image** | Image | 算法快照(源自学术论文) | | **download_url** | String | 源文档的下载链接 | | **instance_name**| String | 实例名称(例如论文ID) | ## **应用场景** 该数据集可用于以下场景: - **算法图文检索**:将算法文本描述与对应图像进行匹配。 - **光学字符识别(OCR)与文本识别**:评估用于结构化文本提取的OCR模型。 - **机器学习研究**:训练用于图像到文本转换的深度学习模型。
提供机构:
maas
创建时间:
2025-04-22
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作