全国车型库通用清洗数据
收藏广东省数据知识产权存证登记平台2024-03-29 更新2024-09-09 收录
下载链接:
https://data.gpic.gd.cn/dataStorage/credentialInfo.jhtml?no=20240344000001214
下载链接
链接失效反馈官方服务:
资源简介:
该数据是用于对国内不同新车网站的品牌、车型、型号、配置数据进行统一清洗并入库,是汽车主数据数据来源和数据质量保证的重要步骤。主要内容为根据不同新车网站的数据按品牌、车型、型号、配置这四个维度进行统一的数据清洗,包括统一字段命名、统一数据类型、统一数据去重规则、统一字段清洗规则。该数据可以用于国内所有新车网站的品牌、车型、型号、配置数据进行统一清洗工作,从而为汽车主数据提供高质量的数据来源。
This dataset is designed for unified data cleaning and storage of brand, vehicle model, variant and configuration data across various domestic new car websites, and constitutes a critical step in securing reliable data sources and ensuring data quality for automotive master data. Its core work involves performing unified data cleaning on data from different new car websites based on four dimensions: brand, vehicle model, variant and configuration, including establishing unified field naming conventions, standardizing data types, formulating unified data deduplication rules, and setting unified field cleaning specifications. This dataset can be utilized for unified cleaning of brand, vehicle model, variant and configuration data from all domestic new car websites, thereby providing high-quality data sources for automotive master data.
提供机构:
广东数鼎科技有限公司
创建时间:
2024-03-29
搜集汇总
数据集介绍

特点
该数据集是国内新车网站品牌、车型、型号、配置数据的统一清洗结果,用于保证汽车主数据的质量和一致性。数据格式为CSV,每周更新,数据量为64000条。
以上内容由遇见数据集搜集并总结生成



