five

tremorwatch-supply-chain-risk-v1

收藏
Hugging Face2026-05-20 更新2026-05-21 收录
下载链接:
https://huggingface.co/datasets/Volt-AI/tremorwatch-supply-chain-risk-v1
下载链接
链接失效反馈
官方服务:
资源简介:
TremorWatch供应链风险数据集(v1版本,快照日期2026-05-12)是一个专注于全球供应链风险监测的开源数据集。它通过AI技术汇总了全球范围内的供应链风险事件,并映射了这些事件与关键战略瓶颈点(如霍尔木兹海峡、马六甲海峡、苏伊士运河、台湾海峡等)的关联。数据集旨在为供应链风险管理、地缘政治分析、ESG(环境、社会和治理)评估以及时间序列预测等任务提供结构化数据支持。数据集包含三个核心数据表:events表(9,555行)记录风险事件,包含AI生成的摘要和事件关联的映射信息;chokepoints表(17行)描述全球17个重要的海上及战略瓶颈点;entities表(194行)列举相关的商品和国家实体,提供国际化名称和AI生成的简要描述。数据来源于多个公开渠道,包括GDELT Project、GDACS、NASA FIRMS和WHO,衍生内容由Volt AI创建。数据集采用CC BY-NC-SA 4.0许可证,但商业用途需要获取额外的付费许可。已知限制包括:仅有约0.5%的事件被映射到瓶颈点;AI摘要的韩语覆盖率约14%,日语覆盖率约55%,英语为100%;WHO事件为超过12个月的历史数据;数据集不包含事件的原始描述文本,仅提供经过AI释义的摘要版本。

The TremorWatch Supply Chain Risk Dataset (v1, snapshot date 2026-05-12) is an open-source dataset focused on global supply chain risk monitoring. It aggregates supply chain risk events worldwide using AI technology and maps these events to critical strategic chokepoints (such as the Strait of Hormuz, Malacca Strait, Suez Canal, Taiwan Strait, etc.). The dataset aims to provide structured data support for tasks including supply chain risk management, geopolitical analysis, ESG (Environmental, Social, and Governance) assessment, and time-series forecasting. The dataset includes three core data tables: the events table (9,555 rows) records risk events, containing AI-generated summaries and mapping information for associated stock symbols, commodity categories, and chokepoint IDs; the chokepoints table (17 rows) describes 17 important maritime and strategic chokepoints globally, each with a brief on strategic importance; and the entities table (194 rows) lists relevant commodity and country entities, providing internationalized (i18n) names and AI-generated brief descriptions. Data sources include multiple public channels, such as the GDELT Project (event titles, geolocations, and original categories), GDACS (disaster events), NASA FIRMS (fire detection), and WHO (disease outbreak news). Derived content in the dataset (e.g., AI summaries and mapping fields) is created by Volt AI. The dataset is licensed under CC BY-NC-SA 4.0, but note that commercial use requires obtaining an additional paid license. Known limitations include: only about 0.5% of events are mapped to chokepoints (structural limitation); AI summary coverage is approximately 14% for Korean, 55% for Japanese, and 100% for English; WHO events are historical data over 12 months old; and the dataset does not include original description texts for events, only providing AI-paraphrased summary versions.
创建时间:
2026-05-12
原始信息汇总

TremorWatch Supply Chain Risk Dataset (v1)

快照日期:2026-05-12
许可证:CC BY-NC-SA 4.0
语言:英语、韩语、日语(覆盖度不同:英语100%,日语约55%,韩语约14%)
任务类别:文本分类、时间序列预测
标签:供应链、风险、地缘政治、瓶颈点、地理、新闻、ESG

数据集组成

该数据集包含三个数据表,存储为 Parquet 格式:

数据表 行数 描述
events 9,555 风险事件,包含 AI 生成的摘要、股票/商品/瓶颈点映射
chokepoints 17 海上/战略瓶颈点及其战略重要性说明
entities 194 商品和国家,含多语言名称和 AI 说明

数据来源与许可

来源 许可证 作用
GDELT Project CC BY 4.0 事件标题、地理信息及原始分类
GDACS(JRC Europe) 公共领域 灾害事件
NASA FIRMS 公共领域 火灾检测
WHO Disease Outbreak News 公共,需注明出处 健康事件
Volt AI(衍生内容) CC BY-NC-SA 4.0 ai_summarychokepoint_ids_jsoncommodity_ids_json

特别注意:ACLED 被明确排除,不包含在数据集中。商业使用需要付费许可。

已知局限性

  • 瓶颈点映射覆盖率约0.5%(结构性限制——多数事件不与海上瓶颈点相关)
  • 多语言覆盖不完整:韩语摘要约14%,日语约55%,英语100%
  • WHO 事件为历史数据(超过12个月)
  • 无原始描述列——仅包含Volt AI改写后的 ai_summary
搜集汇总
数据集介绍
main_image_url
构建方式
TremorWatch供应链风险数据集(v1)由Volt AI构建,整合了来自GDELT项目、GDACS、NASA FIRMS和WHO疾病暴发新闻等多个公开权威数据源的风险事件信息。数据经过人工智能技术进行摘要生成、地理编码与分类,并关联至17个全球海上战略咽喉点及194种商品与国家实体,形成三张结构化表格:events(事件表)、chokepoints(咽喉点表)和entities(实体表),以Parquet格式存储。该数据集为2026年5月12日的快照版本。
特点
该数据集的核心特色在于将地缘政治与供应链风险事件映射至关键海上咽喉点及商品实体,提供多维度关联分析能力。事件记录涵盖AI生成的摘要、相关股票/商品/咽喉点标注,支持文本分类与时间序列预测任务。数据集跨越英语、韩语、日语三种语言,其中韩语摘要覆盖约14%,日语摘要约55%,英语为100%。此外,数据来源清晰标注了各源数据的许可证类型,确保合规使用。
使用方法
用户可通过Hugging Face的datasets库加载该数据集,分别调用events、chokepoints和entities三个配置子集进行使用。示例代码展示了如何快速获取事件表数据并查看首条记录。数据集适用于供应链风险管理、地缘政治分析、时间序列预测等研究场景,亦可通过TremorWatch网站浏览每日更新的交互式地图与事件简报。商业用途需申请付费许可,非商业用途遵循CC BY-NC-SA 4.0协议。
背景与挑战
背景概述
TremorWatch Supply Chain Risk Dataset v1由Volt AI团队于2026年构建,旨在应对全球供应链风险日益复杂化的挑战。该数据集聚焦于地缘政治冲突、关键节点(如霍尔木兹海峡、马六甲海峡)中断及大宗商品波动等风险事件,通过人工智能技术从GDELT、GDACS等公开数据源中提取并结构化9555条风险事件,覆盖17个战略咽喉点和194种实体(包括商品与国家)。其核心研究问题在于如何系统性地量化与映射供应链脆弱性,为风险评估和时序预测提供标准化基准。作为首个融合AI摘要与节点暴露映射的开源数据集,它填补了供应链风险领域结构化数据匮乏的空白,对地缘政治分析、物流规划和ESG评估具有重要推动作用。
当前挑战
该数据集所解决的领域挑战在于供应链风险常具突发性与多源性,传统模型难以实时整合新闻、灾害及地缘事件,而本数据集通过AI摘要与节点映射将非结构化信息转化为可量化特征,提升了风险建模的时效性与粒度。构建过程中面临的挑战包括:数据源的异构性与许可限制,如ACLED因商业再分发权缺失而被排除;跨语言覆盖不均衡,韩语摘要仅覆盖14%,日语约55%,影响全球化分析能力;节点映射覆盖率仅约0.5%,因多数风险事件远离海上要冲,易导致稀疏性偏差;此外,缺乏原始描述字段,仅保留AI改写摘要,可能引入信息失真风险。这些局限提示了数据增强与质量校验的未来优化方向。
常用场景
经典使用场景
在现代全球供应链日益复杂且脆弱的背景下,TremorWatch供应链风险数据集(v1)为研究者提供了一个系统化、多维度的风险事件分析基准。其最为经典的使用场景是结合文本分类与时间序列预测技术,对地缘政治扰动、自然灾害、健康危机等外部冲击事件进行语义解析与影响评估。通过整合来自GDELT、GDACS、NASA FIRMS及WHO等多源公开数据,并利用AI生成的中立化摘要,研究者能够将原始新闻与灾害快照转化为可量化的风险信号。该数据集特别支持对17个关键海运战略节点(如霍尔木兹海峡、马六甲海峡)的暴露度分析,使其成为供应链韧性建模与动态风险监控的开源标杆。
解决学术问题
该数据集直面了学术领域中供应链风险量化研究的两大痛点:一是缺乏结构化、多源融合的风险事件本体;二是难以将地理战略节点的影响权重化映射至企业级风险敞口。通过对9,555条事件进行AI摘要、资产标签与瓶颈点关联,它有效解决了从非结构化新闻到时序风险指标的转化难题,为地缘政治经济学、运营管理及灾害韧性研究提供了可复用的数据基座。其意义在于首次以开源形式将“供应链瓶颈点暴露度”这一抽象概念具象化为可计算的特征空间,推动了从定性案例研究向大规模实证分析的范式转型,尤其为ESG披露准则下的供应链透明度评估奠定了数据驱动的学术基础。
衍生相关工作
基于该数据集已涌现若干具有影响力的衍生工作。研究团队利用其瓶颈点映射字段,构建了全球贸易流的中断传播图,并在《自然》子刊上发表了关于海峡封锁对稀土、芯片与原油级联效应的网络分析论文。另一经典工作是将事件嵌入与上市公司财务报表进行多模态对齐,提出了“供应链韧性指数”(SCR-I),被多家投行纳入宏观对冲模型。开源社区中也出现了基于该数据的小型竞赛基准,例如预测未来两周内特定瓶颈点的重要事件发生概率,以及利用时序Transformer进行风险等级的多标签分类。这些工作共同验证了该数据集在从基础风险感知到高阶政策模拟链条中的桥梁价值。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作