lakshankarunathilake/medmentions_iob

Name: lakshankarunathilake/medmentions_iob
Creator: lakshankarunathilake
Published: 2024-07-01 15:24:21
License: 暂无描述

Hugging Face2024-07-01 更新2024-07-06 收录

下载链接：

https://hf-mirror.com/datasets/lakshankarunathilake/medmentions_iob

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含文本序列（tokens）和对应的命名实体识别标签序列（ner_tags）。数据集分为训练集、验证集和测试集，每个分割包含2635个示例，每个分割的字节数为10848425。数据集的下载大小为6447816字节，总大小为32545275字节。

This dataset contains text sequences (tokens) and corresponding named entity recognition tag sequences (ner_tags). The dataset is divided into training, validation, and test sets, each containing 2635 examples with a byte size of 10848425. The download size of the dataset is 6447816 bytes, and the total size is 32545275 bytes.

提供机构：

lakshankarunathilake

原始信息汇总

数据集概述

特征

tokens: 字符串序列
ner_tags: 整数序列

数据分割

train:
- 样本数: 2635
- 字节数: 10848425
validation:
- 样本数: 2635
- 字节数: 10848425
test:
- 样本数: 2635
- 字节数: 10848425

数据文件

default 配置:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*

数据集大小

下载大小: 6447816 字节
数据集总大小: 32545275 字节

5,000+

优质数据集

54 个

任务类型

进入经典数据集