Vehicle Claim|车辆索赔数据集|审计分析数据集
收藏数据集概述
数据集列表
- Vehicle Claim - 合成数据集,使用DVI数据集创建。
- Car Insurance - 来自Kaggle的数据集,链接:Car Insurance。
- Vehicle Insurance - 来自Github的数据集,链接:Vehicle Insurance。
Vehicle Claim数据集详情
- 创建代码:创建数据集的代码。
- 数据集存储位置:数据集存储位置。
- 属性列表:
Maker
- 分类变量,车辆品牌。GenModel
- 分类变量,车辆型号。Color
- 分类变量,车辆颜色。Reg_Year
- 分类变量,注册年份。Body_Type
- 分类变量,如SUV, Convertible。Runned_Miles
- 数值变量,车辆行驶里程。Engin_Size
- 分类变量,引擎大小。GearBox
- 分类变量,自动或手动。FuelType
- 分类变量,汽油或柴油。Price
- 数值变量,车辆价格。Seat_num
- 数值变量,座位数。Door_num
- 数值变量,车门数。issue
- 分类变量,损坏类型。issue_id
- 分类变量,具体损坏。repair_complexity
- 分类变量,修复难度。repair_hours
- 数值变量,修复所需时间。repair_cost
- 数值变量,修复成本。
训练与评估参数
- 训练参数:
dataset
- 训练数据集选择(vehicle_claims, car_insurance, vehicle_insurance)。data
- 数据类型(正常数据或混合数据)。encoding
- 分类特征编码方式。numerical
- 是否仅使用数值特征。batch_size
- 批量大小。epoch
- 训练周期数。latent_dim
- 潜在空间维度。
- 评估参数:
threshold
- 评估阈值。
引用信息
- 论文引用:
@article{ Author = {Ajay Chawda and Stefanie Grimm and Marius Kloft}, Title = {Unsupervised Anomaly detection for Auditing Data and Impact of Cetgorical Encodings}, Journal = {https://arxiv.org/abs/2210.14056}, Year = {2022}, }

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
CAP-DATA
CAP-DATA数据集由长安大学交通学院的研究团队创建,包含11,727个交通事故视频,总计超过2.19百万帧。该数据集不仅标注了事故发生的时间窗口,还提供了详细的文本描述,包括事故前的实际情况、事故类别、事故原因和预防建议。数据集的创建旨在通过结合视觉和文本信息,提高交通事故预测的准确性和解释性,从而支持更安全的驾驶决策系统。
arXiv 收录
ST-EVCDP
这是一个关于公共电动汽车充电桩的时空充电需求预测的实际数据集,涵盖了18,061个公共充电桩的数据,包括坐标、充电器数量、占用情况和价格等信息。数据集用于学术研究,支持区域电动汽车充电需求预测。
github 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录