交通运输行业通识数据集
收藏国家数据集管理服务平台2026-04-21 更新2026-04-29 收录
下载链接:
https://www.ndsms.cn/dataRetrieval/datasetDetail/?id=0c4eebc3f0329a7d7854a872bb925901
下载链接
链接失效反馈官方服务:
资源简介:
交通运输行业通识数据集是由中国交建支撑,中国交通信息科技集团有限公司建设的高质量行业知识数据集。该数据集旨在解决交通基建行业数据分散、质量参差、标注不规范等问题,推动行业智能化发展。数据集整合了交通基建行业政策文件、标准规范、法律法规、新闻稿件、期刊论文等多源数据,为交通行业大模型训练提供高质量的预训练语料和专业问答对。
The General Knowledge Dataset for Transportation Industry is a high-quality industry knowledge dataset supported by China Communications Construction Group (CCCC) and developed by China Transport Information Technology Group Co., Ltd. This dataset aims to address the issues of data fragmentation, uneven quality, and non-standard annotation in the transportation infrastructure industry, and boost the intelligent development of the sector. The dataset integrates multi-source data including policy documents, standards and specifications, laws and regulations, news releases, and journal papers from the transportation infrastructure industry, providing high-quality pretraining corpora and professional question-answer pairs for the training of large language models (LLMs) in the transportation industry.
提供机构:
中国交通信息科技集团有限公司
创建时间:
2026-04-16
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是由中国交通信息科技集团有限公司建设的高质量行业知识数据集,旨在整合交通基建领域的政策文件、标准规范等多源数据,以解决行业数据分散和质量问题。它提供8TB规模的文本和图文多模态内容,专门用于训练交通行业大模型,并已成功应用于人工智能助手、BIM底座和施工方案智能生成等场景。
以上内容由遇见数据集搜集并总结生成



