five

Nenma/autotrain-data-multiconer2-test1

收藏
Hugging Face2022-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nenma/autotrain-data-multiconer2-test1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由AutoTrain为项目multiconer2-test1自动处理。数据集的语言代码为unk。数据结构包括tokens和tags两个字段,tokens是字符串序列,tags是类别标签序列,共有63个类别。数据集分为训练集和验证集,分别包含2169和829个样本。

This dataset was automatically processed by AutoTrain for the project multiconer2-test1. The language code of the dataset is unk. Its data structure contains two fields: tokens and tags. Tokens are string sequences, while tags are category label sequences, with a total of 63 categories. The dataset is split into training and validation sets, which contain 2169 and 829 samples respectively.
提供机构:
Nenma
原始信息汇总

数据集概述

任务类别

  • 标记分类(token-classification)

数据集描述

  • 该数据集是为项目multiconer2-test1自动处理的。
  • 语言代码为unk。

数据集结构

数据实例

  • 示例数据包含文本中的词汇及其对应的标签。

数据集字段

  • 包含两个主要字段:
    • tokens: 词汇序列,类型为字符串。
    • tags: 标签序列,包含63个类别,用于标记分类。

数据集分割

  • 分割为训练集和验证集:
    • 训练集样本数:2169
    • 验证集样本数:829
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作