nlpso/m0_qualitative_analysis_ref_ptrn_cmbert_io
收藏Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nlpso/m0_qualitative_analysis_ref_ptrn_cmbert_io
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于对[HueyNemud/das22-10-camembert_pretrained]模型在平面NER任务上进行定性分析,包含19世纪巴黎贸易目录的条目。数据集参数包括使用的模型、标记格式、数据分割的数量等。数据集中包含的实体类型包括人名或公司名、个人或公司专业活动、区别、街道名、街道号码和地理特征等。
This dataset is designed for qualitative analysis of the [HueyNemud/das22-10-camembert_pretrained] model on the flat Named Entity Recognition (NER) task, and contains entries from 19th-century Paris trade catalogs. The dataset's parameters include the utilized model, token labeling format, number of data splits, and other relevant details. Entity types covered in this dataset include personal or company names, professional activities of individuals or companies, distinguishing attributes, street names, street numbers, and geographical features, among others.
提供机构:
nlpso
原始信息汇总
m0_qualitative_analysis_ref_ptrn_cmbert_io 数据集概述
数据集简介
本数据集用于对 HueyNemud/das22-10-camembert_pretrained 进行定性分析,专注于扁平NER任务,采用M0方法。数据集内容源自19世纪巴黎贸易目录的条目。
数据集参数
- 方法:M0
- 数据集类型:ground-truth
- 分词器:HueyNemud/das22-10-camembert_pretrained
- 标记格式:IO
- 数据集大小:
- 训练集:6084
- 验证集:676
- 测试集:1685
- 关联的微调模型:nlpso/m0_flat_ner_ref_ptrn_cmbert_io
实体类型
| 缩写 | 描述 |
|---|---|
| O | 非实体部分 |
| PER | 人名或公司名 |
| ACT | 职业活动 |
| TITRE | 荣誉称号 |
| LOC | 街道名 |
| CARDINAL | 街道号码 |
| FT | 地理特征 |
如何使用本数据集
python from datasets import load_dataset
train_dev_test = load_dataset("nlpso/m0_qualitative_analysis_ref_ptrn_cmbert_io")



