sustainability_criteria
收藏Hugging Face2025-12-10 更新2025-12-11 收录
下载链接:
https://huggingface.co/datasets/IntelliProcure/sustainability_criteria
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含按商品和服务组(GGS)组织的可持续采购标准,源自经过验证的Excel文件,并转换为JSONL格式以便于使用。数据集支持英文和德文,包含多个字段如行动领域ID、标准ID、标准类别、采购标准描述等,重点关注可持续性、采购、标准等标签。
创建时间:
2025-12-05
原始信息汇总
Sustainability Procurement Criteria 数据集概述
数据集基本信息
- 数据集名称: Sustainability Procurement Criteria
- 发布者: IntelliProcure
- 许可证: CC-BY-4.0
- 任务类别: 文本分类、文本检索
- 支持语言: 英语、德语
- 标签: 可持续性、采购、标准、德语
- 数据集版本: 1.0
- 最后更新日期: 2025-12-10
- 数据集地址: https://huggingface.co/datasets/IntelliProcure/sustainability_criteria
数据集内容与来源
- 核心内容: 按商品和服务组(GGS,德语:WDG)组织的可持续性采购标准。
- 数据来源: 源自经过验证的Excel文件,并已转换为JSONL格式以便使用。
- 数据字段: 包含标准ID、类别、描述、可持续性维度、雄心水平、证据要求、来源和注释等信息。
数据集结构
文件格式
- 格式: JSONL(JSON Lines),每行一个JSON对象。
- 编码: UTF-8。
- 压缩: 无。
文件组织
- 每个文件对应一个特定的商品和服务组(WDG),包含与该类别相关的采购标准。
- 示例文件名包括
Food_*.jsonl、Construction_Area_*.jsonl、Furniture_*.jsonl等。
数据字段说明
| 字段名(德语) | 类型 | 描述 |
|---|---|---|
Handlungsfeld-ID |
字符串 | 行动领域标识符 |
Handlungsfeld |
字符串 | 行动领域名称(德语) |
Kriterium-ID |
字符串 | 标准标识符 |
Kategorie Kriterium |
字符串 | 标准类别(EK, TS, ZK, TB) |
Ausschreibungskriterium |
字符串 | 采购标准描述 |
Ambitionsniveau: Basis |
字符串 | 基本雄心水平(可选) |
Ambitionsniveau: Gute Praxis |
字符串 | 良好实践雄心水平(可选) |
Ambitionsniveau: Vorbild |
字符串 | 最佳实践/示范性雄心水平(可选) |
Nachweise |
字符串 | 证据/文件要求 |
Nachhaltigkeitsdimensionen |
字符串 | 可持续性维度(生态、社会、经济) |
Quelle |
字符串 | 来源参考 |
Kommentar |
字符串 | 附加注释(可选) |
_sheet |
字符串 | 源工作表名称(Kriterien, Quellen, Legende等) |
数据处理说明
- 空字段省略: 为节省空间,JSON对象中不包含无值的字段。
- 层级数据前向填充:
Handlungsfeld-ID和Handlungsfeld的值向下传播。 - 多工作表数据: 部分文件包含来自多个工作表的数据(通过
_sheet字段指示)。
关键概念定义
标准类别
- EK (Eignungskriterium): 选择标准。
- TS (Technische Spezifikation): 技术规范。
- ZK (Zuschlagskriterium): 授予标准。
- TB (Zwingende Teilnahmebedingung): 强制性参与条件。
可持续性维度
- ökologisch: 环境/生态。
- sozial: 社会。
- ökonomisch: 经济。
雄心水平
- Basis: 基本水平。
- Gute Praxis: 良好实践。
- Vorbild: 最佳实践/示范性。
数据来源
每个标准在 Quelle 字段中包含对源文件的引用。常见来源包括:
- 欧盟绿色公共采购(GPP)标准。
- 德国环境标签和标准。
- 行业特定指南。
- 可持续性认证。
相关参考工作表
- Quellen: 来源参考和参考文献。
- Legende: 图例和缩写定义。
- Mögliche CPV-Divisions: 适用的通用采购词汇表(CPV)分类。
- Kommentar: 附加注释和说明。
使用示例
提供了使用Pandas和标准Python库加载和处理JSONL文件的代码示例。
引用格式
bibtex @dataset{sustainability_criteria, title = {Sustainability Procurement Criteria}, year = {2025}, url = {https://huggingface.co/datasets/IntelliProcure/sustainability_criteria} }
搜集汇总
数据集介绍

构建方式
在可持续采购领域,数据集的构建过程体现了对专业标准的严谨遵循。该数据集源自经过验证的Excel文件,这些文件系统整理了各类商品与服务组别的可持续采购标准。通过转换为JSONL格式,每条记录对应一个独立的JSON对象,确保了数据结构的清晰性与可扩展性。构建过程中,层级数据采用前向填充技术,例如“Handlungsfeld-ID”和“Handlungsfeld”字段自上而下传播,同时空值字段被省略以优化存储效率。数据覆盖了从食品到建筑等多个关键行业,并整合了欧盟绿色公共采购标准、德国环境标签等多方权威来源,形成了结构化的标准体系。
使用方法
在应用层面,该数据集支持多种技术方法进行数据加载与分析。用户可直接使用Pandas库读取JSONL文件,利用DataFrame的筛选功能,按标准类别或可持续维度快速提取目标数据。例如,通过字符串匹配可专门筛选出生态维度的标准条目。若需更细致的处理,亦可采用Python标准库逐行解析JSON对象,灵活访问特定字段内容。数据集适用于文本分类、信息检索等自然语言处理任务,能够为采购决策支持系统、可持续性评估工具的开发提供标准化的语料。其清晰的字段结构与丰富的元数据,使得集成到现有分析流程中变得高效而直接。
背景与挑战
背景概述
随着全球对可持续性发展的日益重视,公共采购作为推动环境、社会与经济三维平衡的关键杠杆,其标准化与透明化需求愈发凸显。Sustainability Procurement Criteria数据集应运而生,由IntelliProcure机构于2025年创建,旨在系统化整理涵盖多类商品与服务的可持续采购标准。该数据集以德语和英语双语呈现,整合了欧盟绿色公共采购准则、德国环境标签及行业特定指南等权威来源,为核心研究问题——如何构建统一、可操作的可持续采购评估框架——提供了结构化数据支持,对公共政策制定、企业社会责任实践及供应链管理研究产生了深远影响。
当前挑战
在可持续采购领域,核心挑战在于如何将抽象的环境、社会与经济维度转化为具体、可量化的评估指标,并适应不同商品服务类别的复杂性。Sustainability Procurement Criteria数据集构建过程中,面临多重挑战:其一,数据源自多样化的Excel文件,需确保跨表格信息的一致性与完整性,同时处理层级结构数据的向前填充逻辑;其二,标准分类体系(如EK、TS、ZK、TB)与可持续性维度(生态、社会、经济)的映射需保持精确,避免语义歧义;其三,多语言字段(如德语术语)的标准化处理与国际化应用存在转换障碍,增加了数据整合与跨文化适用的难度。
常用场景
经典使用场景
在可持续采购领域,数据集的经典使用场景聚焦于文本分类与检索任务。研究人员利用其结构化标准,训练机器学习模型自动识别和归类采购标准中的可持续性维度,例如将标准划分为生态、社会或经济类别。这种应用不仅提升了标准处理的效率,还支持自动化系统在公共或企业采购流程中快速匹配最佳实践,为绿色采购决策提供数据驱动的见解。
解决学术问题
该数据集解决了可持续采购研究中标准规范化与系统化整合的学术难题。通过提供涵盖多商品服务类别的详细标准,它支持学者探索可持续性维度的量化评估方法,例如分析不同抱负水平对采购结果的影响。其意义在于构建了一个可重复使用的基准,促进了跨学科研究,如环境科学、经济学与公共政策的融合,推动了可持续采购理论的实证发展。
实际应用
在实际应用中,数据集被广泛用于公共采购机构和企业可持续发展部门。例如,政府部门可依据数据集中的标准制定招标文件,确保采购活动符合欧盟绿色公共采购准则;企业则利用其优化供应链管理,通过自动化工具筛选符合生态或社会标准的供应商。这种应用不仅增强了采购流程的透明度,还直接促进了可持续实践在实体经济中的落地。
数据集最近研究
最新研究方向
在可持续采购领域,该数据集正推动自然语言处理技术在公共采购文本中的深度应用。研究者们利用其结构化标准,开发多语言分类模型,以自动识别和匹配采购条款中的环境、社会及经济维度。结合欧盟绿色公共采购准则,该数据集支持智能系统对采购文件进行可持续性评估,助力机构实现碳中和目标。同时,其分层标准为生成式人工智能提供了训练基础,用于自动生成符合可持续性要求的招标文本,提升采购流程的透明度和效率。
以上内容由遇见数据集搜集并总结生成



