Nenma/autotrain-data-multiconer2-test1
收藏Hugging Face2022-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nenma/autotrain-data-multiconer2-test1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由AutoTrain为项目multiconer2-test1自动处理。数据集的语言代码为unk。数据结构包括tokens和tags两个字段,tokens是字符串序列,tags是类别标签序列,共有63个类别。数据集分为训练集和验证集,分别包含2169和829个样本。
This dataset was automatically processed by AutoTrain for the project multiconer2-test1. The language code of the dataset is unk. Its data structure contains two fields: tokens and tags. Tokens are string sequences, while tags are category label sequences, with a total of 63 categories. The dataset is split into training and validation sets, which contain 2169 and 829 samples respectively.
提供机构:
Nenma
原始信息汇总
数据集概述
任务类别
- 标记分类(token-classification)
数据集描述
- 该数据集是为项目multiconer2-test1自动处理的。
- 语言代码为unk。
数据集结构
数据实例
- 示例数据包含文本中的词汇及其对应的标签。
数据集字段
- 包含两个主要字段:
tokens: 词汇序列,类型为字符串。tags: 标签序列,包含63个类别,用于标记分类。
数据集分割
- 分割为训练集和验证集:
- 训练集样本数:2169
- 验证集样本数:829



