nlpso/m0_fine_tuning_ref_cmbert_io
收藏Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpso/m0_fine_tuning_ref_cmbert_io
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于微调Jean-Baptiste/camembert-ner模型,采用Flat NER方法进行命名实体识别(NER)任务。数据集包含19世纪巴黎贸易目录的条目。数据集采用M0方法,类型为ground-truth,使用的分词器为Jean-Baptiste/camembert-ner,标记格式为IO。数据集分为训练集(6084条)、开发集(676条)和测试集(1685条)。数据集中包含的实体类型包括:O(非命名实体)、PER(人名或公司名)、ACT(个人或公司的职业活动)、TITRE(头衔)、LOC(街道名称)、CARDINAL(街道号码)、FT(地理特征)。
该数据集用于微调Jean-Baptiste/camembert-ner模型,采用Flat NER方法进行命名实体识别(NER)任务。数据集包含19世纪巴黎贸易目录的条目。数据集采用M0方法,类型为ground-truth,使用的分词器为Jean-Baptiste/camembert-ner,标记格式为IO。数据集分为训练集(6084条)、开发集(676条)和测试集(1685条)。数据集中包含的实体类型包括:O(非命名实体)、PER(人名或公司名)、ACT(个人或公司的职业活动)、TITRE(头衔)、LOC(街道名称)、CARDINAL(街道号码)、FT(地理特征)。
提供机构:
nlpso
原始信息汇总
数据集概述
数据集名称
m0_fine_tuning_ref_cmbert_io
数据集描述
本数据集用于对Jean-Baptiste/camembert-ner模型进行微调,以执行扁平命名实体识别任务,采用M0方法。数据集包含19世纪巴黎贸易目录的条目。
数据集参数
- 方法:M0
- 数据集类型:真实数据
- 分词器:Jean-Baptiste/camembert-ner
- 标记格式:IO
- 数据集大小:
- 训练集:6084条
- 验证集:676条
- 测试集:1685条
- 关联的微调模型:nlpso/m0_flat_ner_ref_cmbert_io
实体类型
- O:非命名实体
- PER:人名或公司名
- ACT:人或公司的职业活动
- TITRE:荣誉称号
- LOC:街道名
- CARDINAL:街道号码
- FT:地理特征
数据集使用方法
python from datasets import load_dataset
train_dev_test = load_dataset("nlpso/m0_fine_tuning_ref_cmbert_io")



