five

lawinsider/uk_ner_contracts_spacy

收藏
Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lawinsider/uk_ner_contracts_spacy
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专为使用SpaCy训练命名实体识别(NER)模型而设计,专注于法律合同领域。数据集包含四种实体类型:合同类型、条款标题、条款编号和定义标题,并涵盖了就业、房地产、服务、销售、租赁等多个领域的法律合同。所有实体均由领域专家手动标注,确保了训练数据的高质量。每个文档的标注格式为(起始位置,结束位置,实体标签),有助于NER模型识别实体文本及其在文档中的位置。该数据集适用于SpaCy管道中NER模型的训练,具体训练方法可参考SpaCy文档。

该数据集专为使用SpaCy训练命名实体识别(NER)模型而设计,专注于法律合同领域。数据集包含四种实体类型:合同类型、条款标题、条款编号和定义标题,并涵盖了就业、房地产、服务、销售、租赁等多个领域的法律合同。所有实体均由领域专家手动标注,确保了训练数据的高质量。每个文档的标注格式为(起始位置,结束位置,实体标签),有助于NER模型识别实体文本及其在文档中的位置。该数据集适用于SpaCy管道中NER模型的训练,具体训练方法可参考SpaCy文档。
提供机构:
lawinsider
原始信息汇总

数据集描述

数据集名称

uk NER contracts

数据集类型

法律合同数据集,用于训练SpaCy命名实体识别(NER)模型。

语言

乌克兰语(uk)

标签

  • 法律
  • 命名实体识别

实体类型

  • 合同类型
  • 条款标题
  • 条款编号
  • 定义标题

数据内容

数据集包含多种类型的法律合同,涵盖就业、房地产、服务、销售、租赁等领域。所有实体均由领域专家手动标注,确保高质量的训练数据。

标注格式

每个文档中的实体标注格式为: (起始位置, 结束位置, 实体标签)

例如,条款标题可能被标注为:(102, 115, clause title)

使用指南

该数据集可加载到SpaCy管道中,用于训练NER模型。更多关于如何使用SpaCy训练NER模型的信息,请参考SpaCy文档。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作