lakshankarunathilake/medmentions_iob
收藏Hugging Face2024-07-01 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/lakshankarunathilake/medmentions_iob
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本序列(tokens)和对应的命名实体识别标签序列(ner_tags)。数据集分为训练集、验证集和测试集,每个分割包含2635个示例,每个分割的字节数为10848425。数据集的下载大小为6447816字节,总大小为32545275字节。
This dataset contains text sequences (tokens) and corresponding named entity recognition tag sequences (ner_tags). The dataset is divided into training, validation, and test sets, each containing 2635 examples with a byte size of 10848425. The download size of the dataset is 6447816 bytes, and the total size is 32545275 bytes.
提供机构:
lakshankarunathilake
原始信息汇总
数据集概述
特征
- tokens: 字符串序列
- ner_tags: 整数序列
数据分割
- train:
- 样本数: 2635
- 字节数: 10848425
- validation:
- 样本数: 2635
- 字节数: 10848425
- test:
- 样本数: 2635
- 字节数: 10848425
数据文件
- default 配置:
- train:
data/train-* - validation:
data/validation-* - test:
data/test-*
- train:
数据集大小
- 下载大小: 6447816 字节
- 数据集总大小: 32545275 字节



