Nenma/autotrain-data-multiconer2-test1

Name: Nenma/autotrain-data-multiconer2-test1
Creator: Nenma
Published: 2022-12-10 14:01:19
License: 暂无描述

Hugging Face2022-12-10 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Nenma/autotrain-data-multiconer2-test1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由AutoTrain为项目multiconer2-test1自动处理。数据集的语言代码为unk。数据结构包括tokens和tags两个字段，tokens是字符串序列，tags是类别标签序列，共有63个类别。数据集分为训练集和验证集，分别包含2169和829个样本。

This dataset was automatically processed by AutoTrain for the project multiconer2-test1. The language code of the dataset is unk. Its data structure contains two fields: tokens and tags. Tokens are string sequences, while tags are category label sequences, with a total of 63 categories. The dataset is split into training and validation sets, which contain 2169 and 829 samples respectively.

提供机构：

Nenma

原始信息汇总

数据集概述

任务类别

标记分类（token-classification）

数据集描述

该数据集是为项目multiconer2-test1自动处理的。
语言代码为unk。

数据集结构

数据实例

示例数据包含文本中的词汇及其对应的标签。

数据集字段

包含两个主要字段：
- tokens: 词汇序列，类型为字符串。
- tags: 标签序列，包含63个类别，用于标记分类。

数据集分割

分割为训练集和验证集：
- 训练集样本数：2169
- 验证集样本数：829

5,000+

优质数据集

54 个

任务类型

进入经典数据集