shujatoor/sroie_ner_instruct
收藏Hugging Face2024-04-24 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/shujatoor/sroie_ner_instruct
下载链接
链接失效反馈官方服务:
资源简介:
该指令数据集可用于微调模型以执行命名实体识别(NER)。数据集包含5.27k个指令示例,这些示例是通过使用SROIE数据集中的973张收据创建的。Paddleocr被用于对原始收据进行OCR处理。数据集的特征包括输入和输出的字符串类型,以及一个包含5270个示例的训练集。
该指令数据集可用于微调模型以执行命名实体识别(NER)。数据集包含5.27k个指令示例,这些示例是通过使用SROIE数据集中的973张收据创建的。Paddleocr被用于对原始收据进行OCR处理。数据集的特征包括输入和输出的字符串类型,以及一个包含5270个示例的训练集。
提供机构:
shujatoor
原始信息汇总
数据集概述
数据集特征
- input: 数据类型为字符串
- output: 数据类型为字符串
数据集划分
- train:
- 数据量: 1303802 字节
- 示例数量: 5270
数据集大小
- 下载大小: 599776 字节
- 数据集大小: 1303802 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
数据集用途
- 用于微调模型以执行命名实体识别(NER)
数据集详情
- 原始收据数量: 约973份
- OCR处理工具: Paddleocr
- 数据集示例数量: 5.27k



