lawinsider/uk_ner_contracts_spacy
收藏Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lawinsider/uk_ner_contracts_spacy
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专为使用SpaCy训练命名实体识别(NER)模型而设计,专注于法律合同领域。数据集包含四种实体类型:合同类型、条款标题、条款编号和定义标题,并涵盖了就业、房地产、服务、销售、租赁等多个领域的法律合同。所有实体均由领域专家手动标注,确保了训练数据的高质量。每个文档的标注格式为(起始位置,结束位置,实体标签),有助于NER模型识别实体文本及其在文档中的位置。该数据集适用于SpaCy管道中NER模型的训练,具体训练方法可参考SpaCy文档。
该数据集专为使用SpaCy训练命名实体识别(NER)模型而设计,专注于法律合同领域。数据集包含四种实体类型:合同类型、条款标题、条款编号和定义标题,并涵盖了就业、房地产、服务、销售、租赁等多个领域的法律合同。所有实体均由领域专家手动标注,确保了训练数据的高质量。每个文档的标注格式为(起始位置,结束位置,实体标签),有助于NER模型识别实体文本及其在文档中的位置。该数据集适用于SpaCy管道中NER模型的训练,具体训练方法可参考SpaCy文档。
提供机构:
lawinsider
原始信息汇总
数据集描述
数据集名称
uk NER contracts
数据集类型
法律合同数据集,用于训练SpaCy命名实体识别(NER)模型。
语言
乌克兰语(uk)
标签
- 法律
- 命名实体识别
实体类型
- 合同类型
- 条款标题
- 条款编号
- 定义标题
数据内容
数据集包含多种类型的法律合同,涵盖就业、房地产、服务、销售、租赁等领域。所有实体均由领域专家手动标注,确保高质量的训练数据。
标注格式
每个文档中的实体标注格式为: (起始位置, 结束位置, 实体标签)
例如,条款标题可能被标注为:(102, 115, clause title)
使用指南
该数据集可加载到SpaCy管道中,用于训练NER模型。更多关于如何使用SpaCy训练NER模型的信息,请参考SpaCy文档。



