BSC-LT/NextProcurement-NER-Spanish-UTE-Company-annotated
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/BSC-LT/NextProcurement-NER-Spanish-UTE-Company-annotated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集以IOB2格式包含公共招标文件中提到的UTEs(Unión Temporal de Empresas)和公司的注释。标注的文档是通过OCR从PDF文件中提取的文本,因此可能存在转录错误。使用的标签是`UTE`(出现656次)和`SINGLE_COMPANY`(出现530次)。数据集支持的任务是标记分类,语言为加泰罗尼亚语(es-ES)。数据集的创建过程包括从欧洲公共采购门户Tenders Electronic Daily(TED)和西班牙国家采购平台(PLACE)抓取的公开招标文件,并使用Prodigy Annotation工具进行手动注释。数据集由巴塞罗那超级计算中心语言技术单位的人员注释,不包含个人或敏感信息。
该数据集以IOB2格式包含公共招标文件中提到的UTEs(Unión Temporal de Empresas)和公司的注释。标注的文档是通过OCR从PDF文件中提取的文本,因此可能存在转录错误。使用的标签是`UTE`(出现656次)和`SINGLE_COMPANY`(出现530次)。数据集支持的任务是标记分类,语言为加泰罗尼亚语(es-ES)。数据集的创建过程包括从欧洲公共采购门户Tenders Electronic Daily(TED)和西班牙国家采购平台(PLACE)抓取的公开招标文件,并使用Prodigy Annotation工具进行手动注释。数据集由巴塞罗那超级计算中心语言技术单位的人员注释,不包含个人或敏感信息。
提供机构:
BSC-LT



