five

IFVI-Global-Value-Factors-Dataset-V2

收藏
Hugging Face2025-08-21 更新2025-08-22 收录
下载链接:
https://huggingface.co/datasets/danielrosehill/IFVI-Global-Value-Factors-Dataset-V2
下载链接
链接失效反馈
官方服务:
资源简介:
全球价值因素数据库(GVFD)V2,由Daniel Rosehill重构,以便于数据分析、机器学习和可视化。重构工作将原始的Excel文件转换为CSV、JSON和Parquet等更易于访问的格式。数据包含多个国家的环境影响因素测量,采用ISO Alpha-2代码进行标准化。重构后的数据集旨在提高GVFD在现代分析流程中的可用性,同时保留原始数据的一致性和方法。
创建时间:
2025-08-17
原始信息汇总

IFVI 全球价值因子数据集 V2 概述

数据集基本信息

  • 名称:IFVI Global Value Factors Database, Data Analysis Refactor, V2
  • 许可证:Apache-2.0
  • 语言:英语
  • 标签:气候
  • 数据规模:100K<n<1M

数据集来源与背景

  • 原始数据提供方:国际影响价值评估基金会(IFVI)
  • 重构工作:Daniel Rosehill 执行的独立重构,旨在提升数据集在机器可读性、数据分析和可视化工作负载中的适用性
  • 数据版本:基于 IFVI 首次发布的全球价值因子数据库(GVFD)V2 版本

核心内容

  • 价值因子:提供将公司的非财务"影响"(社会和环境领域)转换为货币单位(美元)的乘数
  • 应用领域:影响会计,旨在将公司的环境和社会影响整合到财务报告中

环境影响类别

  • 空气污染
  • 土地利用与保护
  • 废物产生
  • 水资源消耗
  • 水污染

数据格式与结构

可用格式

  • CSV 格式
  • JSON 格式(分层结构和紧凑结构)

数据结构

  • 地理覆盖:268 个独特地理位置
  • 国家覆盖:229 个国家(89.5% 具有 ISO 代码)
  • 区域分类:7 个主要世界区域
  • 数据点:约 115,000 个独立测量值

数据访问链接

根目录

  • 重构数据集根目录:https://huggingface.co/datasets/danielrosehill/IFVI-Global-Value-Factors-Dataset-V2/tree/main/refactored

CSV 格式文件

  • 完整数据集:https://huggingface.co/datasets/danielrosehill/Global-Value-Factor-Database-Refactor-V2/blob/main/refactored/csv/combined/combined.csv
  • 各分类数据:空气污染、土地利用、废物管理、水资源消耗、水污染等独立 CSV 文件

JSON 格式文件

  • 完整数据集:https://huggingface.co/datasets/danielrosehill/Global-Value-Factor-Database-Refactor-V2/blob/main/refactored/json/combined/combined-value-factors.json
  • 各分类数据:各环境类别的独立 JSON 文件
  • 按国家组织:JSON 数据按国家分类
  • 美国各州:专门的美国州级数据

技术参数

数值精度分布

  • 4 位小数:64.54%
  • 2 位小数:17.88%
  • 整数:9.62%
  • 其他精度:7.96%

地理参数

  • 具有 ISO 3166-1 代码的实体:72.8%
  • 美国各州(具有州代码):18.7%
  • 非主权实体(无 ISO 代码):8.6%

应用场景

  • AI 工具和 RAG 应用
  • 数据可视化和地理可视化
  • 政策建模和分析
  • Hugging Face 项目集成
  • 影响会计计算器
  • 相关性分析

数据验证

  • ISO 代码验证:89.5% 覆盖率
  • 数据完整性:除水资源消耗(11 个国家)外,其他类别接近完整覆盖
  • 区域分布验证:依据世界银行标准验证

使用建议

  • 数据分析:使用紧凑 JSON 格式进行数据科学工作流
  • 应用开发:分层 JSON 提供嵌套访问模式
  • 地理分析:使用国家聚合文件支持仪表板和可视化需求
搜集汇总
数据集介绍
main_image_url
构建方式
在环境会计学领域,IFVI-Global-Value-Factors-Dataset-V2的构建基于国际价值影响基金会(IFVI)发布的全球价值因子数据库原始数据。该数据集通过系统化重构流程,将原始Excel工作簿中的复杂表格数据转换为机器可读的标准化格式。重构过程包括数据提取、地理编码标准化(采用ISO 3166-1标准)、环境类别分类以及多格式输出生成,涵盖了空气污染、土地利用、废物管理、水资源消耗和水污染五大环境维度,最终形成包含约11.5万个数据点的结构化数据集。
特点
该数据集最显著的特征在于其多维度的环境价值量化体系,将非财务影响转化为货币计量单位(美元)。数据覆盖全球229个地理实体,其中89.5%的区域具备标准化ISO代码,确保了地理参照的精确性。数据集采用分层JSON和紧凑JSON双结构设计,既支持嵌套数据访问模式,也适配快速过滤分析。特别值得注意的是水污染类别包含最细粒度的化学物质排放因子,而其他类别则按污染物类型、土地利用方式等维度进行分层,体现了环境影响的差异化计量特性。
使用方法
研究人员可通过Hugging Face平台获取CSV或JSON格式的数据文件,直接应用于环境金融建模与政策模拟分析。JSON格式特别适合接入向量数据库用于RAG系统开发,而CSV格式则便于传统统计分析。使用时应确保源数据单位与价值因子计量单位的一致性,建议结合地理信息系统进行空间可视化分析。数据集还可与人类发展指数等社会经济指标进行关联分析,探索环境绩效与金融表现的相关性,为可持续发展政策制定提供量化依据。
背景与挑战
背景概述
国际影响价值评估基金会(IFVI)于2024年末发布的全球价值因子数据库(GVFD)代表了环境会计领域的重大突破。该数据集由Daniel Rosehill进行重构优化,旨在通过标准化价值因子将企业环境与社会影响转化为货币计量单位,推动Impact Accounting理论框架的实践应用。其核心研究问题在于解决传统财务核算体系无法量化非财务影响的局限性,通过建立空气污染、土地利用、废弃物管理、水资源消耗和水污染五大类别的价值转换体系,为超过140个采用IFRS准则的国家提供环境影响的货币化评估标准。这一开创性工作为构建融合环境成本的新型会计范式奠定了数据基础,对推动企业可持续发展评估和绿色金融创新具有深远影响。
当前挑战
该数据集面临的核心领域挑战在于解决环境影响的货币化计量难题,需要将异质性的环境指标(如碳排放、水质污染、土地退化等)转化为可比的经济价值,同时确保跨地域、跨行业计量标准的一致性。构建过程中的技术挑战包括:原始Excel数据中229个国家/地区数据的结构化提取与标准化,205个ISO代码的验证映射,以及11.5万条数据点向机器可读格式的转换。特别需要注意的是水污染因子涉及大量化学物质的价值换算,以及非主权实体(占8.6%)的地理编码缺失问题,这些都需要通过复杂的数据清洗和层次化JSON结构设计来实现既保持数据完整性又提升分析可用性的双重目标。
常用场景
经典使用场景
在环境经济学与可持续发展研究领域,该数据集通过标准化价值因子为量化企业非财务影响提供核心框架。研究者将其与公司环境绩效数据结合,构建综合价值评估模型,典型应用于测算碳排放的社会成本、水资源污染的经济代价等场景,为传统财务报告体系外的环境影响货币化转换建立统一基准。
解决学术问题
该数据集解决了环境外部性货币化计量中的标准化缺失问题,使学术界能够基于统一参数比较不同区域、行业的环境影响经济价值。其通过科学建模将空气污染、土地利用、废弃物处理等多元环境维度转化为可比货币单位,为Impact Accounting理论体系提供实证基础,推动ESG指标与财务核算的实质性融合。
衍生相关工作
基于该数据集衍生的经典研究包括:与联合国人类发展指数联动的政策模拟框架、结合自然语言处理的智能环境影响问答系统、以及多区域投入产出模型的环境经济耦合分析。这些工作通过机器学习算法挖掘价值因子的空间异质性规律,推动Impact Accounting从理论框架向可操作工具转化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作