five

IntelliProcure/SwissSPARK_Catalogs

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/IntelliProcure/SwissSPARK_Catalogs
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含[IntelliProcure/sustainability_criteria](https://huggingface.co/datasets/IntelliProcure/sustainability_criteria)上可持续采购标准目录的特定快照版本。此版本用于标注瑞士的招标文件,这些文件构成了[IntelliProcure/SwissSPARK](https://huggingface.co/datasets/IntelliProcure/SwissSPARK)数据集的核心。建议使用[IntelliProcure/SwissSPARK](https://huggingface.co/datasets/IntelliProcure/SwissSPARK)的用户使用此特定目录版本以确保一致性,因为新版本可能与原始标注中使用的版本不同。

This dataset contains a specific snapshot of the sustainability procurement criteria catalogs available at [IntelliProcure/sustainability_criteria](https://huggingface.co/datasets/IntelliProcure/sustainability_criteria). This version was used to annotate Swiss calls for tender, which form the core of the [IntelliProcure/SwissSPARK](https://huggingface.co/datasets/IntelliProcure/SwissSPARK) dataset. Users working with [IntelliProcure/SwissSPARK](https://huggingface.co/datasets/IntelliProcure/SwissSPARK) are advised to use this specific catalog version to ensure consistency, as newer iterations may differ from those used in the original annotation.
提供机构:
IntelliProcure
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自IntelliProcure/sustainability_criteria中可持续采购标准目录的特定快照,旨在为瑞士公共采购招标文件的可持续性标注提供支撑。通过从原始目录中提取关键标准条目,并整理为适用于文本分类任务的格式,最终形成包含德语法律文本的标注数据集。数据集仅含单一训练集,以catalogs_for_annotation.json文件存储,便于直接加载与使用。
特点
数据集规模极小(n<1K),专注于德语法律领域的文本分类任务,具有高度专业化特征。其核心价值在于与IntelliProcure/SwissSPARK主数据集保持版本一致性,确保标注结果的可靠复现。作为辅助资源,它明确标记为持续开发状态,提示用户注意潜在的迭代变化。数据集采用CC-BY-4.0许可协议,鼓励学术与商业场景下的开放使用。
使用方法
用户可通过HuggingFace Datasets库直接加载default配置下的训练集,数据以JSON格式存储,内含可持续采购标准条目。建议与IntelliProcure/SwissSPARK主数据集协同使用,将本数据集的标注标准应用于瑞士招标文件的分类与分析。由于数据集处于动态更新阶段,使用时需关注版本号以确保标注一致性,避免因目录迭代导致结果偏差。
背景与挑战
背景概述
瑞士可持续公共采购领域近年来受到广泛关注,尤其是在环境与社会责任日益成为公共支出核心考量的背景下。SwissSPARK_Catalogs数据集作为IntelliProcure项目的重要组成部分,由瑞士研究团队于近期创建,旨在为瑞士公开招标中的可持续采购标准提供系统化标注支持。该数据集从IntelliProcure/sustainability_criteria中提取特定快照,用于注释核心数据集IntelliProcure/SwissSPARK中的招标文本。其核心研究问题在于如何通过结构化分类标准,推动可持续采购行为的数据化分析与合规性评估。该数据集对瑞士公共采购透明化、标准化具有重要贡献,为后续的可持续性分析报告工具研发奠定了数据基础。
当前挑战
该数据集面临多重挑战。首先,可持续采购标准的多样性使得分类体系难以统一,不同机构对可持续性定义存在差异,导致标注一致性难以保障。其次,数据集规模极小(n<1K),样本稀疏性限制了模型泛化能力,易引发过拟合与偏差累积。此外,构建过程中需应对德语招标文本的语言复杂性,专有名词与法律术语的精准标注成为技术难点。最显著的问题是数据集处于持续迭代状态,版本变动可能导致与SwissSPARK主数据集的标注不一致,对下游任务的可复现性构成威胁。
常用场景
经典使用场景
SwissSPARK_Catalogs数据集专为瑞士公共采购领域的可持续发展标准标注任务而设计。其最经典的用途是作为辅助工具,与SwissSPARK主数据集协同工作,为瑞士招标公告中的可持续采购条款提供统一的分类标签体系。通过预定义的采购标准目录,该数据集支持文本分类模型的训练与评估,帮助研究者将非结构化的招标文本映射至结构化的可持续性指标,从而实现对采购实践的系统性量化分析。
实际应用
在实际应用中,该数据集被嵌入到瑞士可持续采购分析与报告工具包中,服务于公共部门与企业的采购流程监控。政府机构可利用其自动检测招标公告中是否包含环保材料要求、社会公平条款或碳减排承诺,进而优化采购政策。咨询公司则借助该数据集构建智能审核系统,快速识别合规风险点并生成供应链可持续性报告。此外,科研机构将其用于开发多语言文本分类器,以应对德语为主的瑞士招标文本的语义复杂性。
衍生相关工作
围绕该数据集已衍生出一系列关键研究工作。最核心的是IntelliProcure/SwissSPARK主数据集,其利用该目录完成了数千份瑞士招标公告的可持续性标注,成为训练司法文本分类模型的基准资源。在此基础上,研究者开发了针对公共采购的零样本学习框架,并探索跨语种迁移学习以覆盖意大利语或法语招标文件。部分工作还扩展至可持续性标准的层级化建模,尝试将瑞士框架与其他国际可持续采购分类体系(如欧盟绿色公共采购标准)进行语义对齐与融合。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作