five

severson-2019

收藏
Hugging Face2026-05-12 更新2026-05-13 收录
下载链接:
https://huggingface.co/datasets/bsebench-org/severson-2019
下载链接
链接失效反馈
官方服务:
资源简介:
Severson 2019 LFP Fastcharge数据集是BSEBench项目提供的Tier 2规范化版本,源自Severson等人于2019年在《自然·能源》上发表的商业磷酸铁锂(LFP)电池快充循环原始数据。该数据集旨在为电池状态估计(如荷电状态SOC、健康状态SOH)算法提供标准化基准测试数据。数据集包含124个电池单体的时间序列测量数据,这些单体来自三个实验批次,并已应用原始研究中定义的排除掩码,移除了未达到容量阈值或存在噪声的通道。每个数据样本包含8个关键字段:电池单体标识符(cell_id)、实验时间戳(time_s)、端电压(voltage_V)、遵循BPX-1.1符号约定(充电为正,放电为负)的电流(current_A)、电池壳表面温度(temperature_C)、1索引的循环编号(cycle_number)、循环内步骤标识(step_id)以及基于库仑计数法计算的累积容量(capacity_Ah)。数据集不提供SOC和SOH的真实值轨迹,因为原始研究未发布连续参考值。数据以Parquet格式存储,使用Zstandard压缩,并按cell_id分区,便于并行读取和高效访问单个电池数据。原始三个.mat文件总计约7.6GB,预计压缩后大小约为8GB。该数据集适用于时间序列预测、表格回归任务,特别是电池状态估计滤波器的开发与基准测试。数据遵循Creative Commons Attribution 4.0 International (CC-BY-4.0)许可协议。
创建时间:
2026-04-29
原始信息汇总

数据集概述:Severson 2019 LFP Fastcharge — BSEBench Canonical (Tier 2)

基本信息

  • 数据集名称:Severson 2019 LFP Fastcharge — BSEBench Canonical (Tier 2)
  • 许可协议:Creative Commons Attribution 4.0 International (CC-BY-4.0)
  • 语言:英语
  • 数据规模:100M < n < 1B
  • 任务类型:时间序列预测、表格回归
  • 标签:电池、荷电状态、健康状态、锂离子、LFP、磷酸铁锂、快速充电、循环、卡尔曼滤波、基准测试

数据来源与背景

该数据集源自 Severson 等人 2019 年发表的商业 LFP 快速充电循环数据集,是对原始三个 .mat 文件的 BSEBench 标准 Parquet 格式重构版本。原始数据来自 TRI Energy & Materials Datasets 平台。

数据集状态

重要提示:这是一个占位卡,标准化的 Parquet 文件尚未上传。需满足三个前提条件后才能发布:

  1. 原始镜像上传并提交 SHA-256 摘要
  2. bsebench-specs 包达到 v0.2.0 并发布标准 TimeSeriesSchema 模型
  3. 实现并测试标准化适配器

目标数据结构

数据集将按照 BSEBench 标准 TimeSeriesSchema 存储,使用 Zstandard 压缩的 Parquet 格式,并按 cell_id 分区。

列名 类型 描述
cell_id string 稳定电池标识符(如 b1c0, b1c1, ..., b3c45)
time_s float64 自实验开始以来的秒数
voltage_V float64 端电压(范围通常为 2.0–3.6 V)
current_A float64 电池电流(BPX-1.1 符号约定:充电为正,放电为负)
temperature_C float64 电池表面温度(摄氏度)
cycle_number int32 以 1 为起始的循环计数
step_id string 循环内步骤标识(charge, rest_after_charge, discharge, rest_after_discharge)
capacity_Ah float64 累积容量(通过库仑计数得到)

未提供的列soc_truthsoh_truth — 该数据不提供参考 SOC 轨迹和连续 SOH 真实值。

估计数据大小

  • 未压缩:约 50 GB
  • Zstandard 压缩后:约 8 GB

排除电池列表

根据 Severson 等作者发布的 124 电池标准队列,以下电池被排除:

  • 批次 1:b1c8, b1c10, b1c12, b1c13, b1c22
  • 批次 2:b2c7, b2c8, b2c9, b2c15, b2c16
  • 批次 3:b3c2, b3c23, b3c32, b3c37, b3c42, b3c43

总计:140 个原始通道 → 124 个已发布电池。

字段映射说明

BSEBench 列 Severson 源字段 转换方式
cell_id 合成 f"b{batch_idx}c{channel_idx}"
time_s batch.cycles[i].t 连接累积偏移
voltage_V batch.cycles[i].V 直接复制
current_A batch.cycles[i].I 保持原始符号(与 BPX-1.1 一致)
temperature_C batch.cycles[i].T 直接复制
cycle_number batch.summary.cycle +1 偏移(转为 1 索引)
step_id batch.policy_readable + 启发式方法 识别充/放/静置段
capacity_Ah batch.cycles[i].Qc, Qd 累积容量重建

引用格式

bibtex @article{severson2019datadriven, author = {Severson, Kristen A. and Attia, Peter M. and Jin, Norman and Perkins, Nicholas and Jiang, Benben and Yang, Zi and Chen, Michael H. and Aykol, Muratahan and Herring, Patrick K. and Fraggedakis, Dimitrios and Bazant, Martin Z. and Harris, Stephen J. and Chueh, William C. and Braatz, Richard D.}, title = {Data-driven prediction of battery cycle life before capacity degradation}, journal = {Nature Energy}, volume = {4}, number = {5}, pages = {383--391}, year = {2019}, doi = {10.1038/s41560-019-0356-8}, }

@misc{bsebench2026, author = {Akir, Oussama and {BSEBench Contributors}}, title = {{BSEBench}: an open-source benchmark for battery state-estimation filters}, year = {2026}, }

相关链接

  • 原始出版物:https://doi.org/10.1038/s41560-019-0356-8
  • 原始数据门户:https://data.matr.io/1/projects/5c48dd2bc625d700019f3204
  • BSEBench 文档:https://bsebench.org
搜集汇总
数据集介绍
main_image_url
构建方式
severson-2019 数据集源自 Severson 等人于 2019 年发布的商业磷酸铁锂电池快充循环实验数据,原始数据以三个 .mat 文件形式存在。BSEBench 项目对其进行二级规范化处理,将原始数据映射到统一的 BSEBench TimeSeriesSchema 架构,并以 Parquet 格式存储,采用 Zstandard 压缩。数据按 cell_id 进行分区,便于并行读取。构建过程中,对原始数据进行了符号约定对齐(遵循 BPX 1.1 标准,充电电流为正)、周期编号从 0 索引转换为 1 索引,并应用了已发表论文中的排除掩码,剔除了未达到容量阈值或存在噪声的电池通道,最终得到 124 个有效电池单元的标准化时间序列数据。
特点
该数据集的核心特点在于其高度的标准化与互操作性。作为 BSEBench 的二级规范版本,它统一了列名、数据类型和符号约定,使得基于该数据集开发的滤波算法可直接迁移至其他 BSEBench 数据集(如 NASA Random Walk 2014、Sandia 2020 等),无需额外适配。数据以 Parquet 格式存储并分区,支持毫秒级读取单个电池单元,极大提升了大规模基准测试的效率。此外,数据集已剔除原始数据中的分析性元数据,仅保留状态估计必需的电压、电流、温度、容量和时间序列字段,并提供了运行时的符号一致性校验机制,确保数据质量与可靠性。
使用方法
推荐的使用方式是通过 bsebench-datasets Python 包中的 load_bsebench() 函数一行加载数据集,例如:ds = load_bsebench("severson-2019", revision="v1.0"),即可获取包含 124 个电池单元的标准化数据对象。对于不使用该包的场景,也可通过 huggingface_hub 的 snapshot_download 函数下载数据分区,再使用 Pandas 读取特定电池单元(如 df = pd.read_parquet(f"{local_dir}/cell_id=b1c0"))。数据包含 cell_id、time_s、voltage_V、current_A、temperature_C、cycle_number、step_id、capacity_Ah 共八个标准字段。由于该数据集未提供参考的荷电状态与健康状态真值,用户需根据需求自行从容量数据中推导。
背景与挑战
背景概述
锂离子电池的健康状态与荷电状态估计是电池管理系统(BMS)的核心技术挑战,其中基于数据驱动的方法因其无需复杂电化学模型而备受关注。Severson等人于2019年在《Nature Energy》上发表了关于商业磷酸铁锂(LFP)电池快充循环寿命预测的里程碑式研究,其团队来自麻省理工学院、丰田研究所等机构,构建了包含124个商业LFP电芯的快充老化数据集。该数据集通过标准化循环测试协议,记录了电压、电流、温度及容量等关键时序参数,为电池寿命预测算法提供了可靠的基准。这一数据集的发布极大推动了机器学习在电池退化预测领域的应用,成为后续十余年研究中的标杆性资源。
当前挑战
该数据集所解决的领域挑战在于:传统电池循环寿命预测依赖大量长期老化实验,成本高昂且周期漫长,而Severson-2019数据集通过早期循环数据即可预测电池寿命,显著提升了预测效率。然而,构建过程中面临多重挑战:原始数据源自三个MATLAB二进制文件,格式不统一且缺乏标准化;实验批次间存在通道噪声与异常电芯(如未达到80%容量阈值的样本)需人工剔除;此外,电流符号惯例(充电正/负)在原始文件中未明确标注,需通过积分校验确保物理一致性。为实现跨数据集的对比研究,后续还需将原始异构结构转换为统一的时间序列模式(BSEBench规范),并处理因缺乏连续SOC/SOH真值带来的模型评估难题。
常用场景
经典使用场景
在电池健康管理与寿命预测领域,severson-2019数据集堪称里程碑式的基石。该数据集记录了124块商用磷酸铁锂电池在快速充电循环工况下的电压、电流、温度等时序信号,并提供了充放电容量等汇总特征。经典使用场景集中于构建基于机器学习的数据驱动预测模型,通过从早期循环(如前100个循环)中提取的放电容量衰减特征来预测电池的剩余循环寿命。研究者通常利用该数据集训练回归模型,实现电池寿命的早期预测,有效避免了对电池进行全生命周期测试的高昂时间成本。
实际应用
在工程落地层面,该数据集直接服务于电动汽车电池管理系统与储能电站的运维策略优化。利用该数据训练的快速寿命预测模型可植入BMS,实现电池组剩余使用年限的在线估算,指导梯次利用与报废决策。同时,数据集催生了针对LFP电池特性优化的快速充电协议开发,使充电速度与电池健康度的权衡更具量化依据,显著降低了电池厂商进行材料筛选与配方验证时所需的实验批次和时间成本。
衍生相关工作
基于该数据集,学术界涌现出大量经典衍生工作。以特征工程为核心的文献提出了容量衰减曲线斜率、电极电压平台变化等新型诊断指标;深度学习方法则引入了卷积神经网络、循环神经网络以及注意力机制提取时序特征。代表性工作包括Attia等人利用该数据集开发‘特征发现’框架,以及各类融合物理信息与数据驱动的混合模型。此外,该数据也被用于验证迁移学习能力,即将一种快充协议下训练的预测器适应于其他充电策略的电池数据,拓展了模型的泛化边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作