kkchaulagain/ocr-dataset
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/kkchaulagain/ocr-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:id、image和conversations。其中,conversations是一个列表,包含from和value两个字段。数据集只有一个训练集(train),包含202个样本,总大小为30953字节。下载大小为14416字节。
The dataset includes user IDs, images, and conversation records. The conversation records detail the initiator and content of the conversations. The dataset is primarily used for training models, containing 202 training samples with a total size of 30953 bytes.
提供机构:
kkchaulagain
原始信息汇总
数据集概述
数据集基本信息
- 名称: ocr-dataset
- 描述: kkchaulagain/ocr-dataset 数据集托管在 HF Mirror 上,由 HF Datasets 社区贡献。
- 别名: kkchaulagain/ocr-dataset
- 创建者: Kiran Chaulagain
- 链接: 数据集链接
数据集详细信息
- 格式: Parquet
- 关键词:
- < 1K
- parquet
- Text
- Datasets
- pandas
- Croissant
- 🇺🇸 Region: US
- 符合标准: http://mlcommons.org/croissant/1.0
数据集内容
- 默认子集:
- 名称: default
- 描述: kkchaulagain/ocr-dataset - default 子集
- 1 个跳过的列: conversations
- 字段:
- id:
- 描述: 来自 HF Mirror parquet 文件的列 id。
- 数据类型: 文本
- image:
- 描述: 来自 HF Mirror parquet 文件的列 image。
- 数据类型: 文本
- id:
数据集分布
- 文件对象:
- 名称: repo
- 描述: HF Mirror git 仓库。
- 内容链接: 仓库链接
- 编码格式: git+https
- 文件集:
- 名称: parquet-files-for-config-default
- 描述: 由 HF Mirror 转换的基础 Parquet 文件(参见: Parquet 文档)。
- 包含于: repo
- 编码格式: application/x-parquet
- 包含文件: default//.parquet



