cvlt-mao/bc5cdr
收藏Hugging Face2024-01-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cvlt-mao/bc5cdr
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本序列(tokens)及其对应的标签序列(tags),标签用于标注化学物质(Chemical)和疾病(Disease)。数据集分为训练集、验证集和测试集,分别包含5228、5330和5865个示例。
该数据集包含文本序列(tokens)及其对应的标签序列(tags),标签用于标注化学物质(Chemical)和疾病(Disease)。数据集分为训练集、验证集和测试集,分别包含5228、5330和5865个示例。
提供机构:
cvlt-mao
原始信息汇总
数据集概述
特征
- tokens: 序列类型,字符串。
- tags: 序列类型,包含类别标签,具体标签如下:
- 0: O
- 1: B-Chemical
- 2: B-Disease
- 3: I-Disease
- 4: I-Chemical
数据分割
- train:
- 字节数: 1888772
- 样本数: 5228
- validation:
- 字节数: 1881130
- 样本数: 5330
- test:
- 字节数: 2000887
- 样本数: 5865
数据集大小
- 下载大小: 1118925 字节
- 数据集大小: 5770789 字节
配置
- default:
- 训练数据路径: data/train-*
- 验证数据路径: data/validation-*
- 测试数据路径: data/test-*



