TransGPT-pt&sft 交通对话预训练数据集
收藏超神经2025-01-21 更新2024-12-28 收录
下载链接:
https://hyper.ai/cn/datasets/36756
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为北京交通大学于 2024 年发布的国内首款综合交通大模型 TransGPT 的一部分,包含了约 34.6 万条交通领域文本数据,这些数据用于领域内预训练,以及约 5.8 万条交通领域对话数据,用于微调。相关论文成果为「TransGPT: Multi-modal Generative Pre-trained Transformer for Transportation」。
This dataset is a component of TransGPT, the first domestic comprehensive transportation large model released by Beijing Jiaotong University in 2024. It contains approximately 346,000 transportation-domain text samples for in-domain pre-training, as well as around 58,000 transportation-domain dialogue samples for fine-tuning. The associated academic paper is titled "TransGPT: Multi-modal Generative Pre-trained Transformer for Transportation".
创建时间:
2024-12-25
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是北京交通大学于2024年发布的国内首款综合交通大模型TransGPT的一部分,包含约34.6万条交通领域文本数据用于预训练和约5.8万条交通领域对话数据用于微调。数据来源多样,覆盖多个交通相关行业,旨在为交通领域的自然语言处理任务提供通识常识支持。
以上内容由遇见数据集搜集并总结生成



