supply-chain-predictions

Hugging Face2026-04-03 更新2026-04-04 收录

下载链接：

https://huggingface.co/datasets/LightningRodLabs/supply-chain-predictions

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于评估模型基于噪声和非结构化输入对供应链中断事件进行校准概率预测的能力。数据集包含一个测试集，共有452个样本，每个样本包含以下特征：sample_id（唯一标识符）、prediction_date（预测日期）、correct_answer（真实中断结果）、parsed_answer（从模型输出中提取的预测）、prompt（提供给模型的输入，包括角色和内容）以及reasoning（模型生成的预测推理过程）。该数据集与论文《Forecasting Supply Chain Disruptions with Foresight Learning》相关联，旨在评估模型在预测罕见高影响供应链中断事件中的表现。

创建时间：

2026-04-02

原始信息汇总

数据集概述

基本信息

数据集名称: supply-chain-predictions
发布机构: LightningRodLabs
关联论文: Forecasting Supply Chain Disruptions with Foresight Learning
任务类别: 时间序列预测

数据集详情

设计目的: 评估模型基于噪声和非结构化输入，对不频繁、高影响的供应链中断事件生成校准概率预测的能力。
数据规模: 下载大小 1,959,011 字节，数据集大小 4,201,349 字节。
数据格式: 包含一个测试集拆分。

数据结构

拆分: test
样本数量: 452 个
特征字段:
- sample_id: 每个评估样本的唯一标识符（字符串类型）。
- prediction_date: 与预测相关的日期（字符串类型）。
- correct_answer: 中断事件的真实结果（整数类型）。
- parsed_answer: 从模型输出中提取的预测（字符串类型）。
- prompt: 提供给模型的特定输入，包含角色和内容（列表类型，内含content和role字段）。
- reasoning: 模型为其预测生成的推理或思考过程（字符串类型）。

搜集汇总

数据集介绍

构建方式

在供应链预测领域，精准评估模型对罕见高影响事件的预测能力至关重要。该数据集的构建源于前瞻性学习框架，专门设计用于测试模型基于嘈杂非结构化输入生成校准概率预测的性能。其测试集包含452个样本，每个样本均具备唯一标识符、预测日期、真实结果及模型解析答案，同时整合了包含角色与内容的提示信息以及模型生成的推理过程，从而系统化地模拟了实际供应链中断预测场景。

特点

该数据集的核心特点在于其专注于低频高冲击的供应链中断事件，通过结合时间序列预测与自然语言处理任务，提供了多维度评估指标。数据集不仅包含结构化的预测结果与真实标签，还保留了模型输入的提示文本和内部推理链条，使得研究者能够深入分析模型决策的透明性与逻辑一致性。这种设计有助于揭示模型在复杂不确定性环境下的校准能力与泛化表现。

使用方法

使用该数据集时，研究者可将其应用于供应链中断预测模型的评估与比较。典型流程包括加载测试分割数据，基于提供的提示信息运行预测模型，并将生成的解析答案与真实结果进行对比。通过分析预测准确性、校准误差以及推理过程的合理性，能够全面衡量模型在实际应用中的可靠性。该数据集可直接支持概率预测、不确定性量化及可解释人工智能等相关研究方向的实验验证。

背景与挑战

背景概述

供应链预测领域长期致力于通过数据驱动方法应对不确定性风险，supply-chain-predictions数据集应运而生，其源自论文《Forecasting Supply Chain Disruptions with Foresight Learning》的研究成果。该数据集由相关学术团队于近期构建，核心目标在于评估模型基于嘈杂非结构化输入，对低频高影响供应链中断事件进行校准概率预测的能力。这一创新尝试将时间序列预测与事件概率建模相结合，为供应链风险管理提供了新的评估基准，有望推动预测模型在复杂现实场景中的实用化进展。

当前挑战

该数据集致力于解决供应链中断事件的概率预测问题，其核心挑战在于如何从噪声显著的非结构化数据中准确捕捉罕见但影响巨大的中断信号，这对模型的鲁棒性与校准能力提出了极高要求。在构建过程中，研究者需克服标注困难，因为高影响事件样本稀疏且真实结果难以追溯验证；同时，设计能够平衡历史数据与实时信息的提示结构也是一项关键难题，以确保评估既反映预测准确性，也涵盖模型的可解释性。

常用场景

经典使用场景

在供应链管理领域，预测罕见但高影响的中断事件是核心挑战之一。该数据集专为评估模型在嘈杂和非结构化输入下生成校准概率预测的能力而设计，其经典使用场景涉及利用时间序列预测方法，模拟真实世界供应链中的不确定性，通过分析历史数据和文本提示，模型需预测特定日期是否会发生中断事件。这一场景不仅测试了模型的预测精度，还强调了其处理稀疏事件和概率校准的鲁棒性，为供应链风险管理的量化分析提供了标准化基准。

衍生相关工作

围绕该数据集衍生的经典工作主要集中在增强预测模型的架构与评估方法上。例如，基于“前瞻学习”框架的研究扩展了多模态融合技术，结合文本推理与时间序列分析以提升预测准确性；同时，一系列工作聚焦于概率校准算法，如贝叶斯深度学习或集成方法，以改进不确定性量化。这些衍生研究不仅推动了供应链预测领域的算法创新，还催生了跨领域基准测试，促进了学术界与工业界在风险智能系统开发中的合作，为后续更复杂的预测任务奠定了方法论基础。

数据集最近研究