five

bergoliveira/pl-corpus

收藏
Hugging Face2023-05-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bergoliveira/pl-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
pl-corpus是UlyssesNER-Br项目的一部分,该项目是一个用于命名实体识别(NER)的巴西立法文件语料库。该数据集包含150份巴西众议院的公共法案,这些法案经过手动注释,包含语义类别和类型。数据集的语言为巴西葡萄牙语。
提供机构:
bergoliveira
原始信息汇总

数据集概述

数据集基本信息

  • 名称: PL-corpus
  • 语言: 巴西葡萄牙语 (pt)
  • 类别: 法律、立法
  • 许可证: 未知
  • 大小: 10K<n<100K

数据集描述

  • 概述: PL-corpus是UlyssesNER-Br的一部分,包含150份巴西众议院的公共法案,这些法案经过手动标注,包含语义类别和类型。
  • 支持的任务: 需要更多信息
  • 数据结构: 需要更多信息

数据集创建

  • 数据来源: 需要更多信息
  • 标注过程: 需要更多信息
  • 个人和敏感信息: 需要更多信息

使用数据集的考虑

  • 社会影响: 需要更多信息
  • 偏见讨论: 需要更多信息
  • 其他已知限制: 需要更多信息

附加信息

  • 数据集管理员: 需要更多信息
  • 许可证信息: 需要更多信息
  • 引用信息:

@InProceedings{ALBUQUERQUE2022, author="Albuquerque, Hidelberg O. and Costa, Rosimeire and Silvestre, Gabriel and Souza, Ellen and da Silva, N{a}dia F. F. and Vit{o}rio, Douglas and Moriyama, Gyovana and Martins, Lucas and Soezima, Luiza and Nunes, Augusto and Siqueira, Felipe and Tarrega, Jo{~a}o P. and Beinotti, Joao V. and Dias, Marcio and Silva, Matheus and Gardini, Miguel and Silva, Vinicius and de Carvalho, Andr{e} C. P. L. F. and Oliveira, Adriano L. I.", title="{UlyssesNER-Br}: A Corpus of Brazilian Legislative Documents for Named Entity Recognition", booktitle="Computational Processing of the Portuguese Language", year="2022", pages="3--14", }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作