【我遇到的问题】 • 现象:该数据集的下载链接已失效 【相关信息】 • 可考虑访问这个链接获取类似文件~https://www.selectdataset.com/dataset/3688356173feccbcf1f1e490ddc6bc72
SRNI-CAR
收藏arXiv2023-12-19 更新2024-06-21 收录
下载链接:
https://srni-car.github.io
下载链接
链接失效反馈官方服务:
资源简介:
SRNI-CAR是一个全面的数据集,用于分析中国汽车市场。该数据集由亚当斯密商学院的团队创建,涵盖了2016至2022年的销售数据、在线评论和汽车行业新闻信息。数据集包含多种变量,如车型属性、品牌特征、价格、时间因素等,旨在解决现有数据集在覆盖范围和多样性变量方面的不足。SRNI-CAR不仅支持市场预测准确性的提升,还扩展了商业应用的范围,为政策制定和监管提供信息,并推动汽车行业的学术研究。
SRNI-CAR is a comprehensive dataset dedicated to the analysis of the Chinese automotive market. Developed by a team from the Adam Smith Business School, this dataset encompasses sales data, online reviews, and automotive industry news information spanning from 2016 to 2022. It includes a diverse set of variables such as vehicle model attributes, brand characteristics, pricing, temporal factors and more, aiming to address the deficiencies of existing datasets in terms of coverage breadth and variable diversity. Beyond enhancing the accuracy of market forecasting, SRNI-CAR also expands the scope of business applications, provides valuable insights for policy formulation and regulatory supervision, and promotes academic research in the automotive industry.
提供机构:
亚当斯密商学院
创建时间:
2023-12-19
搜集汇总
数据集介绍

构建方式
在汽车行业数据日益成为市场分析与学术研究核心资源的背景下,SRNI-CAR数据集通过系统整合多源异构信息构建而成。其数据采集自中国权威汽车媒体平台,包括太平洋汽车网、懂车帝与汽车之家,覆盖2016年至2022年的时间跨度。构建过程不仅涵盖了车型销售数据、消费者在线评论及行业新闻资讯,还引入了品牌原产国、车型与品牌入市时序等关键变量,并对缺失值与异常值进行了严谨清洗。通过人工补充实际交易价格与官方指导价,并实现销售数据与评论数据的月度同步,该数据集在变量丰富性与时序一致性上实现了显著提升。
特点
SRNI-CAR数据集的核心特点在于其多维度的综合性与精细化的变量设计。数据集包含销售、评论与行业新闻三大模块,其中销售数据涵盖1236个车系,评论数据基于超过21万条车主反馈,新闻资讯则包含8万余条标注信息。变量体系不仅覆盖车型属性、品牌特征、价格动态等传统维度,更创新性地整合了车型上市日期、品牌创立时间等时序指标,以及针对不同车辆属性的细粒度评分与文本评论。这种设计使得数据集能够同时支持宏观市场趋势分析与微观消费者行为洞察,尤其为新能源汽车市场研究提供了结构化数据基础。
使用方法
该数据集适用于汽车市场预测、消费者行为分析与行业政策评估等多类研究场景。在应用时,研究者可基于销售模块进行时序建模,结合价格变量与入市时序探究市场动态;利用评论模块的细粒度评分与文本数据,通过情感分析技术挖掘消费者偏好;行业新闻模块则可用于构建事件研究框架或舆情监测模型。数据集已提供标准化CSV格式,支持直接导入常见数据分析工具。建议在使用时注意各模块间的变量关联,例如通过车型名称与时间字段进行数据融合,并可参考原论文提供的XGBoost与SHAP分析框架建立预测与解释一体化模型。
背景与挑战
背景概述
在全球化经济格局中,汽车产业作为关键支柱行业,其市场动态与消费行为研究始终是学术界与工业界关注的焦点。随着中国汽车市场规模的持续扩张及其对全球汽车生态系统的深远影响,构建一个全面、多维度的数据集以支撑精准市场分析与预测显得尤为迫切。在此背景下,格拉斯哥大学亚当·斯密商学院的研究团队于2023年推出了SRNI-CAR数据集,该数据集整合了2016年至2022年间中国汽车市场的销售数据、在线评论及行业新闻信息,旨在填补现有数据在变量覆盖广度与深度上的不足。该数据集不仅涵盖了车型属性、品牌渊源、价格动态及消费者情感等多维度变量,还引入了车型上市时间、品牌创立日期等先前缺失的关键信息,为销售预测、消费者行为分析及产业政策制定提供了坚实的数据基础,显著提升了相关领域研究的准确性与可解释性。
当前挑战
SRNI-CAR数据集致力于解决汽车市场分析中多源数据融合与复杂变量建模的核心挑战。在领域问题层面,传统汽车销售预测模型常因数据碎片化而难以整合行业动态、消费者情感与市场反馈,导致预测偏差;该数据集通过融合销售、评论与新闻数据,旨在应对非线性市场因素交互影响的建模难题,提升在激烈竞争与环保政策压力下的预测鲁棒性。在构建过程中,研究团队面临多源异构数据对齐的挑战,例如需手动补充车型实际交易价格以分析折扣效应,并同步月度销售与评论数据以确保时序一致性;同时,数据清洗需处理在线评论中的缺失值与异常值,并排除进口车型销售数据以保持数据集聚焦于本土市场,这些步骤均对数据的完整性与可靠性提出了较高要求。
常用场景
经典使用场景
在汽车市场分析领域,SRNI-CAR数据集为研究者提供了整合销售数据、在线评论及行业新闻的综合性资源,其经典应用场景体现在利用机器学习模型进行精准的销售预测。通过结合XGBoost算法与SHAP解释框架,该数据集能够深入剖析价格动态、消费者情感、品牌起源及车型特征等多维变量对销量的影响,从而揭示市场趋势与消费者偏好之间的复杂关联。
衍生相关工作
基于SRNI-CAR数据集,学术界衍生出一系列聚焦于汽车市场分析的经典研究工作。这些研究不仅拓展了销售预测模型的多变量集成方法,还深入探讨了在线评论情感与评分间的交互机制,以及品牌历史与市场进入时序对消费者偏好的长期影响。相关成果进一步推动了文本挖掘、消费者行为建模及产业政策评估等领域的方法融合与理论深化。
数据集最近研究
最新研究方向
在汽车产业数字化转型的浪潮中,SRNI-CAR数据集为深入解析中国汽车市场提供了多维度的数据支撑。该数据集整合了销售数据、在线评论及行业资讯,其前沿研究聚焦于融合机器学习与文本挖掘技术,以揭示消费者行为与市场动态的复杂关联。热点方向包括利用XGBoost模型结合SHAP可解释性框架,量化车型上市时间、品牌入华顺序等时序变量对销售预测的影响,同时通过情感分析挖掘评论文本中隐含的消费者偏好,尤其关注新能源汽车市场的政策效应与品牌竞争格局。这些研究不仅提升了市场预测的精准度,也为车企战略制定与政策评估提供了实证依据,推动了汽车产业数据分析向智能化、精细化方向发展。
相关研究论文
- 1SRNI-CAR: A comprehensive dataset for analyzing the Chinese automotive market亚当斯密商学院 · 2023年
以上内容由遇见数据集搜集并总结生成



