GermEval-SustainEval-2025

Hugging Face2025-05-13 更新2025-05-14 收录

下载链接：

https://huggingface.co/datasets/ReminiScenceAI/GermEval-SustainEval-2025

下载链接

链接失效反馈

官方服务：

资源简介：

SustainEval 2025提供的数据集，包含两个任务：任务A是一个分类任务，涉及企业社会责任和可持续性相关的18个分类标签；任务B是对文本片段末句的可验证性进行评分。具体的数据集内容和详细用途未在README中描述。

创建时间：

2025-05-13

原始信息汇总

GermEval-SustainEval-2025 数据集概述

基本信息

许可证: Apache-2.0
提供方: SustainEval 2025

任务A：分类

描述

对文本进行分类，涵盖多个可持续发展相关主题。

包含标签

Strategic Analysis and Action
Materiality
Objectives
Depth of the Value Chain
Responsibility
Rules and Processes
Control
Incentive Systems
Stakeholder Engagement
Innovation and Product Management
Usage of Natural Resources
Resource Management
Climate-Relevant Emissions
Employment Rights
Equal Opportunities
Qualifications
Human Rights
Corporate Citizenship
Political Influence
Conduct that Complies with the Law and Policy

任务B：可验证性评分

描述

评估文本片段中最后一句话的可验证性，前面的句子作为上下文。

评分标准

评分范围: 0.0（不可验证）到 1.0（明确可验证）
评估方法: 使用Kendall τ秩相关性与人类评分进行比较

搜集汇总

数据集介绍

构建方式

在可持续发展报告分析领域，GermEval-SustainEval-2025数据集通过系统化标注框架构建而成。该数据集涵盖企业可持续发展报告的20个核心维度，包括战略分析、资源管理、气候变化、人权保障等关键要素。标注过程采用专业的环境社会治理标准，确保每个文本片段都能准确对应到具体的ESG分类体系，为研究提供可靠的基准数据支撑。

特点

该数据集最显著的特点是双任务并行设计，既包含细粒度的多标签分类任务，又提供可验证性评分机制。分类任务覆盖从战略规划到具体实施的完整价值链，评分任务则采用0到1的连续度量标准，能够精确评估陈述的可验证程度。这种复合结构使得数据集既能支持传统的文本分类研究，又能满足对信息可信度分析的进阶需求。

使用方法

研究人员可依据任务需求分别使用该数据集的两个模块。对于分类任务，可利用20个预定义标签进行多标签分类模型训练；对于可验证性评估，则需结合上下文语境对末句进行评分预测。数据集采用肯德尔等级相关系数作为评估指标，确保模型输出与人工评判保持一致性，为可持续发展报告自动分析提供完整的技术路径。

背景与挑战

背景概述

随着全球可持续发展理念的深化，企业环境社会治理的透明度成为学术与实务界关注焦点。GermEval-SustainEval-2025数据集由SustainEval组织于2025年构建，旨在通过自然语言处理技术解析企业可持续发展报告中的结构化信息。该数据集聚焦企业社会责任报告的自动分类与可验证性评估两大核心任务，覆盖战略分析、资源管理、人权保障等二十个可持续发展维度，为量化企业ESG表现提供了标准化的语义分析基准。

当前挑战

在可持续发展报告分析领域，传统方法难以精准捕捉非结构化文本中隐含的多维度治理信息。GermEval-SustainEval-2025面临双重挑战：其任务A需解决二十类细粒度标签的语义重叠问题，例如区分战略分析与目标设定间的概念边界；任务B要求构建上下文感知的可验证性评分体系，需克服主观标注一致性难题。数据构建过程中，专业术语的歧义消歧与跨语言文化背景的标注规范统一，进一步增加了数据集构建的复杂性。

常用场景

经典使用场景

在可持续性报告分析领域，GermEval-SustainEval-2025数据集通过其细粒度的二十类标签体系，为自动文本分类任务提供了标准化的评估基准。该数据集常被用于训练机器学习模型识别企业报告中涉及战略分析、资源管理、人权保障等关键维度的内容，帮助研究者系统化地解析可持续发展信息的组织结构与表达特征。

解决学术问题

该数据集有效解决了可持续性文本分析中标注粒度不足与评估维度单一的问题。通过构建涵盖治理结构、环境影响、社会责任等多层次的标签体系，为量化研究企业信息披露质量提供了数据基础，显著推进了可持续性语言理解模型的可解释性与评估效度研究。

衍生相关工作

基于该数据集的可验证性评分任务，学界涌现出多模态证据检索与声明验证的相关研究。部分工作通过结合上下文语义建模与可验证性量化预测，构建了企业声明可信度评估框架，进一步推动了可持续性信息审计技术向细粒度、可解释的方向发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集