hibikaze/Synthetic-TextWebImages
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/hibikaze/Synthetic-TextWebImages
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为ner-wikipedia-dataset,包含图像、HTML、文本、ID、数据集仓库、文本长度和大小等多个特征。数据集包括一个训练集,共有32个样本,总大小为986614字节,下载大小为684183字节。
The dataset ner-wikipedia-dataset includes features such as image, HTML, text, ID, dataset repository link, text length, and size. It is divided into a training set with 32 examples, totaling 986614 bytes. The download size of the dataset is 684183 bytes.
提供机构:
hibikaze
原始信息汇总
数据集概述
数据集信息
- 配置名称: ner-wikipedia-dataset
特征
- image: 图像数据,数据类型为
image - html: HTML 文本,数据类型为
string - text: 文本数据,数据类型为
string - id: 标识符,数据类型为
int64 - dataset_repo: 数据集仓库信息,数据类型为
string - text_len: 文本长度,数据类型为
int64 - size: 数据大小,数据类型为
string
数据分割
- train: 训练集
- num_bytes: 986614.0 字节
- num_examples: 32 个样本
数据集大小
- download_size: 684183 字节
- dataset_size: 986614.0 字节
配置
- config_name: ner-wikipedia-dataset
- data_files:
- split: train
- path: ner-wikipedia-dataset/train-*



