Vehicle Maintenance Data|汽车维护数据集|车辆修理数据集
收藏数据集概述
数据集名称
- Predictive Maintenance in the Automobile Industry Through a Data-Driven Approach
项目目标
- 利用详细车辆数据预测维护需求,实现主动维护策略。
数据描述
- 数据包含来自车辆车队的详细信息,包括维护频率、发动机类型、维修成本、关键故障等。
- 数据已匿名化,通过在线检查确认,反映了现实的汽车行业场景。
方法论
- 使用探索性数据分析(EDA)和预测建模来识别模式并预测维护需求。
- 工具包括Python(使用pandas、matplotlib和scikit-learn)以及Excel中的数据生成。
关键问题与结果
-
年龄和里程对维护频率和关键故障的影响
- 结果显示这些变量之间的相关性几乎可以忽略不计。
-
车辆使用(个人与商业)对平均维修成本和维修次数的影响
- 商业车辆的平均维修成本较低,但维修频率略高。
-
不同发动机类型(如汽油、柴油、电动、混合动力)的维护需求和成本差异
- 电动和柴油发动机车辆的维护频率较低,但维修成本较高;混合动力发动机虽然维护频率最高,但平均维修成本最低。
-
警告信号数量与维护所需严重性或关键故障发生的关系
- 警告信号与关键故障之间的相关性非常弱。
-
自上次维护以来的时间与车辆整体维护和维修历史(包括成本和关键故障)的关系
- 自上次维护以来的时间与关键故障和平均维修成本之间的相关性非常弱。
结论
- 预测维护可以根据车辆使用、年龄和发动机类型进行定制,尽管本项目中的差异不明显。
- 警告信号和自上次维护以来的时间对关键故障或维护成本的预测价值有限。
建议
- 开发考虑多种因素的更精细的预测模型。
- 增强对操作指标的数据收集,以实现更准确的预测,包括实时监控和历史分析。
- 根据车辆使用模式和发动机类型实施针对性的维护策略,以优化维护计划并减少不必要的支出。

lmarena-ai/arena-human-preference-100k
这个数据集包含了2024年6月至2024年8月期间收集的排行榜对话数据。它包括用于开发Arena Explorer的英语人类偏好评价。此外,我们还提供了一个嵌入文件,其中包含了英语对话的预计算嵌入,这些嵌入用于主题建模管道以对这些对话进行分类和分析。
hugging_face 收录
PACT (Pairwise Auction Conversation Testbed)
PACT是一个用于语言模型对话议价的基准测试数据集。在每个20轮的匹配中,一个语言模型扮演买家,一个扮演卖家,双方都有隐藏的私有价值。每轮他们交换简短的公共消息,然后发布出价或要价;当出价满足要价时交易达成。数据集包含5000+个1对1游戏,每个游戏20轮,并提供完整的对话日志
github 收录
QM9
QM9数据集包含134k个有机小分子化合物的量子化学计算结果,涵盖了12个量子化学性质,如分子能量、电离能、电子亲和能等。
quantum-machine.org 收录
MIMII数据集
MIMII数据集是由日立有限公司研究与开发集团创建的,专注于工业机器异常声音检测的数据集。该数据集包含26,092个正常操作条件下的声音文件,涵盖阀门、泵、风扇和滑轨四种机器类型。数据集的创建过程中,使用了TAMAGO-03麦克风阵列进行声音采集,并在多个真实工厂环境中混合背景噪声以模拟实际环境。MIMII数据集主要用于机器学习和信号处理社区开发自动化设施维护系统,特别是在无监督学习场景下检测机器异常声音。
arXiv 收录
中国区域250米植被覆盖度数据集(2000-2024)
该数据集是中国区域2000至2024年月度植被覆盖度产品,空间分辨率250米,合成方式采用月最大值合成,每年12期,共299期。本产品采用基于归一化植被指数(NDVI)像元二分模型,根据土地利用类型确定纯植被像元值和纯裸土像元值,实现植被覆盖度计算。本产品去除湖泊、河流、冰川/永久积雪等区域。其中,NDVI数据来源于国家青藏高原科学数据中心中国区域250米归一化植被指数数据集(2000-2024)产品。通过时空变化趋势分析检验法分析,该数据集符合时间变化趋势和空间变化趋势。该数据集能够为全国区域生态质量评价、重要生态空间调查评估等工作提供数据参考。
国家青藏高原科学数据中心 收录