datasciathlete/klue-edit
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/datasciathlete/klue-edit
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本数据及其对应的命名实体识别标签,分为训练集和验证集。训练集包含15481个样本,验证集包含3939个样本。数据集特征包括tokens(文本序列)和ner_tags(命名实体标签序列),其中ner_tags定义了7种标签,包括B-PS, I-PS, B-OG, I-OG, B-LC, I-LC, 和 O。
该数据集包含文本数据及其对应的命名实体识别标签,分为训练集和验证集。训练集包含15481个样本,验证集包含3939个样本。数据集特征包括tokens(文本序列)和ner_tags(命名实体标签序列),其中ner_tags定义了7种标签,包括B-PS, I-PS, B-OG, I-OG, B-LC, I-LC, 和 O。
提供机构:
datasciathlete
原始信息汇总
数据集概述
特征信息
- tokens: 序列类型为字符串。
- ner_tags: 序列类型为类别标签,具体标签包括:
- 0: B-PS
- 1: I-PS
- 2: B-OG
- 3: I-OG
- 4: B-LC
- 5: I-LC
- 6: O
数据分割
- train: 包含15481个样本,大小为13119725字节。
- validation: 包含3939个样本,大小为3420394字节。
数据集大小
- 下载大小: 1905853字节
- 数据集大小: 16540119字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-*
- train: 路径为



