bergoliveira/pl-corpus
收藏Hugging Face2023-05-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bergoliveira/pl-corpus
下载链接
链接失效反馈官方服务:
资源简介:
pl-corpus是UlyssesNER-Br项目的一部分,该项目是一个用于命名实体识别(NER)的巴西立法文件语料库。该数据集包含150份巴西众议院的公共法案,这些法案经过手动注释,包含语义类别和类型。数据集的语言为巴西葡萄牙语。
提供机构:
bergoliveira
原始信息汇总
数据集概述
数据集基本信息
- 名称: PL-corpus
- 语言: 巴西葡萄牙语 (pt)
- 类别: 法律、立法
- 许可证: 未知
- 大小: 10K<n<100K
数据集描述
- 概述: PL-corpus是UlyssesNER-Br的一部分,包含150份巴西众议院的公共法案,这些法案经过手动标注,包含语义类别和类型。
- 支持的任务: 需要更多信息
- 数据结构: 需要更多信息
数据集创建
- 数据来源: 需要更多信息
- 标注过程: 需要更多信息
- 个人和敏感信息: 需要更多信息
使用数据集的考虑
- 社会影响: 需要更多信息
- 偏见讨论: 需要更多信息
- 其他已知限制: 需要更多信息
附加信息
- 数据集管理员: 需要更多信息
- 许可证信息: 需要更多信息
- 引用信息:
@InProceedings{ALBUQUERQUE2022, author="Albuquerque, Hidelberg O. and Costa, Rosimeire and Silvestre, Gabriel and Souza, Ellen and da Silva, N{a}dia F. F. and Vit{o}rio, Douglas and Moriyama, Gyovana and Martins, Lucas and Soezima, Luiza and Nunes, Augusto and Siqueira, Felipe and Tarrega, Jo{~a}o P. and Beinotti, Joao V. and Dias, Marcio and Silva, Matheus and Gardini, Miguel and Silva, Vinicius and de Carvalho, Andr{e} C. P. L. F. and Oliveira, Adriano L. I.", title="{UlyssesNER-Br}: A Corpus of Brazilian Legislative Documents for Named Entity Recognition", booktitle="Computational Processing of the Portuguese Language", year="2022", pages="3--14", }



