BatteryLife|电池寿命数据集|数据挖掘数据集
收藏BatteryLife 数据集概述
数据集简介
- 数据集名称:BatteryLife
- 描述:BatteryLife 是一个用于电池寿命预测的综合数据集和基准测试。
数据集特点
- 最大规模的电池寿命数据集:集成 16 个数据集,包含来自 998 个电池的超过九十万样本,是之前最大电池寿命资源 BatteryML 的 2.4 倍。
- 最多样化的电池寿命数据集:包含 8 种电池格式,80 种化学系统,12 种操作温度,以及 646 种充放电协议。相比 BatteryML,BatteryLife 提供 4 倍的格式,16 倍的化学系统,2.4 倍的操作温度,以及 3.4 倍的充放电协议。
- 全面的电池寿命预测基准测试:提供 18 种基准方法及开源代码。
数据可用性
- 处理后的数据集可通过以下方式获取:
- 从 Huggingface 下载。
- 从 Zenodo 下载。
- 原始数据集公开可用,可通过以下链接下载:
快速入门
- 安装:
pip install -r requirements.txt
,还需安装 BatteryML。 - 预处理:运行
python preprocess_scripts.py
。 - 训练模型:运行
sh ./train_eval_scripts/CPTransformer.sh
。 - 评估模型:运行
sh ./train_eval_scripts/evaluate.sh
。
贡献指南
- 欢迎社区贡献更多标准化数据集,以提交 pull request 或通过邮箱 rtan474@connect.hkust-gz.edu.cn 和 whong719@connect.hkust-gz.edu.cn 联系。
引用
- 如发现此工作有用,请引用 BatteryLife 论文(即将提供)。
- 请引用原始实验论文和 BatteryArchive 作为数据源。
致谢
- 本仓库基于以下仓库构建:Time-Series-Library 和 BatteryML。

FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
poi
本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。
github 收录
CHARLS
中国健康与养老追踪调查(CHARLS)数据集,旨在收集反映中国45岁及以上中老年人家庭和个人的高质量微观数据,用以分析人口老龄化问题,内容包括健康状况、经济状况、家庭结构和社会支持等。
charls.pku.edu.cn 收录
网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录