explosion/ner-fashion-brands
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/explosion/ner-fashion-brands
下载链接
链接失效反馈官方服务:
资源简介:
该数据集最初作为[此教程](https://github.com/explosion/projects/tree/v3/tutorials/ner_fashion_brands)的一部分出现。数据集的目标是检测Reddit评论中的时尚品牌。更多详细信息,请阅读[此博客文章](https://explosion.ai/blog/sense2vec-reloaded#annotation)。
提供机构:
explosion
原始信息汇总
数据集概述
数据集信息
- 特征列表:
text: 类型为stringmeta: 结构化数据,包含section,类型为string_input_hash: 类型为int64_task_hash: 类型为int64tokens: 列表类型,包含以下字段:end: 类型为int64id: 类型为int64start: 类型为int64text: 类型为string
spans: 列表类型,包含以下字段:end: 类型为int64input_hash: 类型为int64label: 类型为stringsource: 类型为stringstart: 类型为int64text: 类型为stringtoken_end: 类型为int64token_start: 类型为int64
_session_id: 类型为null_view_id: 类型为stringanswer: 类型为string
数据集划分
- 训练集:
- 文件路径:
data/train-* - 字节数:2222165
- 样本数:1235
- 文件路径:
- 评估集:
- 文件路径:
data/eval-* - 字节数:898819
- 样本数:500
- 文件路径:
数据集大小
- 下载大小:839865 字节
- 数据集大小:3120984 字节



