five

Backblaze Disk Stats Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://www.backblaze.com/b2/hard-drive-test-data.html
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了自2013年以来每天收集的数据中心可运行硬盘的信息,其中包括硬盘信息以及早期错误检测的指标。此外,数据集还包含了19个时间序列的SMART特征,用于预测硬盘故障。规模上,该数据集大约有700万个样本,其中约0.05%被标记为故障样本。任务目标是进行硬盘故障预测。

This dataset contains operational information on hard disk drives (HDDs) in data centers, collected daily since 2013. The collected data includes hard disk drive details and early error detection metrics. Additionally, the dataset includes 19 time-series SMART features for hard disk failure prediction. In terms of scale, the dataset has approximately 7 million samples, with about 0.05% of them labeled as faulty samples. The task objective of this dataset is hard disk failure prediction.
提供机构:
Backblaze
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Backblaze硬盘统计数据数据集是一个开源数据集,包含自2013年以来Backblaze数据中心硬盘驱动器(HDD)和固态驱动器(SSD)的每日快照、年度故障率(AFR)及S.M.A.R.T.统计数据。该数据集按季度或年度以CSV文件形式提供,可用于分析硬盘可靠性和性能,并支持通过Apache Iceberg格式进行查询。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作