five

nlpso/m0_fine_tuning_ref_cmbert_io

收藏
Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpso/m0_fine_tuning_ref_cmbert_io
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于微调Jean-Baptiste/camembert-ner模型,采用Flat NER方法进行命名实体识别(NER)任务。数据集包含19世纪巴黎贸易目录的条目。数据集采用M0方法,类型为ground-truth,使用的分词器为Jean-Baptiste/camembert-ner,标记格式为IO。数据集分为训练集(6084条)、开发集(676条)和测试集(1685条)。数据集中包含的实体类型包括:O(非命名实体)、PER(人名或公司名)、ACT(个人或公司的职业活动)、TITRE(头衔)、LOC(街道名称)、CARDINAL(街道号码)、FT(地理特征)。

该数据集用于微调Jean-Baptiste/camembert-ner模型,采用Flat NER方法进行命名实体识别(NER)任务。数据集包含19世纪巴黎贸易目录的条目。数据集采用M0方法,类型为ground-truth,使用的分词器为Jean-Baptiste/camembert-ner,标记格式为IO。数据集分为训练集(6084条)、开发集(676条)和测试集(1685条)。数据集中包含的实体类型包括:O(非命名实体)、PER(人名或公司名)、ACT(个人或公司的职业活动)、TITRE(头衔)、LOC(街道名称)、CARDINAL(街道号码)、FT(地理特征)。
提供机构:
nlpso
原始信息汇总

数据集概述

数据集名称

m0_fine_tuning_ref_cmbert_io

数据集描述

本数据集用于对Jean-Baptiste/camembert-ner模型进行微调,以执行扁平命名实体识别任务,采用M0方法。数据集包含19世纪巴黎贸易目录的条目。

数据集参数

实体类型

  • O:非命名实体
  • PER:人名或公司名
  • ACT:人或公司的职业活动
  • TITRE:荣誉称号
  • LOC:街道名
  • CARDINAL:街道号码
  • FT:地理特征

数据集使用方法

python from datasets import load_dataset

train_dev_test = load_dataset("nlpso/m0_fine_tuning_ref_cmbert_io")

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作