nqv2291/vi-mT5-ner-VinAI-COVID_19_NER

Name: nqv2291/vi-mT5-ner-VinAI-COVID_19_NER
Creator: nqv2291
Published: 2024-06-27 14:39:43
License: 暂无描述

Hugging Face2024-06-27 更新2024-06-29 收录

下载链接：

https://hf-mirror.com/datasets/nqv2291/vi-mT5-ner-VinAI-COVID_19_NER

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含三个主要特征：input_ids、attention_mask和labels，分别表示输入ID序列、注意力掩码序列和标签序列。数据集分为多个子集，包括train_100、train_500、train_1k、train_5k、train_full和val，每个子集都有对应的字节大小和样本数量。数据集的下载大小为2409420字节，总大小为16952130字节。

The dataset contains three main features: input_ids, attention_mask, and labels, representing input ID sequences, attention mask sequences, and label sequences, respectively. The dataset is divided into several subsets, including train_100, train_500, train_1k, train_5k, train_full, and val, each with corresponding byte sizes and number of examples. The download size of the dataset is 2409420 bytes, and the total size is 16952130 bytes.

提供机构：

nqv2291

原始信息汇总

数据集概述

特征

input_ids: 序列类型为 int32
attention_mask: 序列类型为 int8
labels: 序列类型为 int64

数据集划分

train_100: 包含 100 个样本，占用 76272 字节
train_500: 包含 500 个样本，占用 388738 字节
train_1k: 包含 1000 个样本，占用 782325 字节
train_5k: 包含 5000 个样本，占用 3895468 字节
train_full: 包含 10335 个样本，占用 8079549 字节
val: 包含 4576 个样本，占用 3729778 字节

数据集大小

下载大小: 2409420 字节
数据集总大小: 16952130 字节

配置

default:
- train_100: 路径为 data/train_100-*
- train_500: 路径为 data/train_500-*
- train_1k: 路径为 data/train_1k-*
- train_5k: 路径为 data/train_5k-*
- train_full: 路径为 data/train_full-*
- val: 路径为 data/val-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集