mabounassif/nyt_ingredient_phrase_ner
收藏Hugging Face2024-02-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mabounassif/nyt_ingredient_phrase_ner
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含四个主要字段:id、input、tokens和tags。其中,tags字段是一个序列,包含五个类别标签:I-QTY、I-UNIT、I-NAME、I-COMMENT和I-OTHER。数据集分为训练集和测试集,分别包含125555和53652个样本。数据集的下载大小为7543614字节,总大小为28705281字节。
该数据集包含四个主要字段:id、input、tokens和tags。其中,tags字段是一个序列,包含五个类别标签:I-QTY、I-UNIT、I-NAME、I-COMMENT和I-OTHER。数据集分为训练集和测试集,分别包含125555和53652个样本。数据集的下载大小为7543614字节,总大小为28705281字节。
提供机构:
mabounassif
原始信息汇总
数据集概述
数据集特征
- id: 数据类型为字符串。
- input: 数据类型为字符串。
- tokens: 序列类型,数据类型为字符串。
- tags: 序列类型,包含类别标签,标签名称如下:
- 0: I-QTY
- 1: I-UNIT
- 2: I-NAME
- 3: I-COMMENT
- 4: I-OTHER
数据集划分
- train: 包含20,110,373字节,125,555个样本。
- test: 包含8,594,908字节,53,652个样本。
数据集大小
- 下载大小: 7,543,614字节。
- 数据集大小: 28,705,281字节。
配置
- default: 包含以下数据文件:
- train: 路径为
data/train-*。 - test: 路径为
data/test-*。
- train: 路径为



