bltlab/queryner
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/bltlab/queryner
下载链接
链接失效反馈官方服务:
资源简介:
QueryNER是一个用于电子商务查询分割的序列标注数据集,包含17种不同的实体类型。该数据集涵盖了查询的广泛部分,而不仅仅是某些关键方面。数据集是从Amazon的ESCI Shopping Queries数据集中选取的一部分进行注释的。
QueryNER是一个用于电子商务查询分割的序列标注数据集,包含17种不同的实体类型。该数据集涵盖了查询的广泛部分,而不仅仅是某些关键方面。数据集是从Amazon的ESCI Shopping Queries数据集中选取的一部分进行注释的。
提供机构:
bltlab
原始信息汇总
数据集概述
名称: QueryNER
描述: QueryNER是一个用于电子商务查询分割的序列标注数据集,包含17种不同的实体类型。该数据集旨在将查询分割成有意义的块,适用于广泛的应用类型。
语言: 英语
许可: CC-BY 4.0
数据集结构
特征:
- tokens: 字符串序列
- ner_tags: 序列标签,包含以下类别:
- 0: O
- 1: B-UoM
- 2: I-UoM
- 3: B-color
- 4: I-color
- 5: B-condition
- 6: I-condition
- 7: B-content
- 8: I-content
- 9: B-core_product_type
- 10: I-core_product_type
- 11: B-creator
- 12: I-creator
- 13: B-department
- 14: I-department
- 15: B-material
- 16: I-material
- 17: B-modifier
- 18: I-modifier
- 19: B-occasion
- 20: I-occasion
- 21: B-origin
- 22: I-origin
- 23: B-price
- 24: I-price
- 25: B-product_name
- 26: I-product_name
- 27: B-product_number
- 28: I-product_number
- 29: B-quantity
- 30: I-quantity
- 31: B-shape
- 32: I-shape
- 33: B-time
- 34: I-time
分割:
- train: 7841个样本,553523字节
- test: 993个样本,70308字节
- validation: 871个样本,61109字节
下载大小: 242711字节
数据集大小: 684940字节
使用场景
直接使用: 用于电子商务查询分割的研究和下游系统。
注意事项: 由于数据集较小,使用模型训练可能对域外数据的性能不佳。



