TripCraft
收藏arXiv2025-02-28 更新2025-03-04 收录
下载链接:
http://arxiv.org/abs/2502.20508v1
下载链接
链接失效反馈官方服务:
资源简介:
TripCraft是一个包含1000个旅行查询的细粒度空间时间旅行规划数据集,涵盖140个美国城市,包含3天、5天和7天的行程。该数据集完全由真实世界数据源构建,确保地理一致性、有效的公共交通连接和情境准确的活动和景点信息。它整合了公共交通站点和时刻表,支持生成实际的公共交通感知行程,并包含多样化的景点和活动类别,如音乐会、博物馆和体育活动,以增强行程的丰富性。此外,TripCraft建模了用户画像,捕捉旅行风格、预算偏好和位置偏好,以实现更加个性化和情境相关的旅行规划体验。
TripCraft is a fine-grained spatio-temporal travel planning dataset consisting of 1,000 travel queries, covering 140 U.S. cities and featuring 3-day, 5-day, and 7-day itineraries. This dataset is fully constructed from real-world data sources, ensuring geographic consistency, valid public transit connections, and contextually accurate activity and attraction information. It integrates public transit stops and timetables, enabling the generation of practical public-transport-aware itineraries, and includes diverse categories of attractions and activities such as concerts, museums, and sporting events to enhance the richness of the itineraries. Additionally, TripCraft models user profiles, capturing travel styles, budget preferences, and location preferences to deliver more personalized and contextually relevant travel planning experiences.
提供机构:
印度理工学院巴布纳校区
创建时间:
2025-02-28
搜集汇总
数据集介绍

构建方式
TripCraft数据集通过从现实世界数据源中收集信息来构建,确保了地理一致性、有效的交通连接以及上下文准确的景点和活动信息。数据集整合了公共交通站点和时间表,使得能够生成真实的交通感知行程计划,并包含了多样的景点和活动类别,如音乐会、博物馆和体育活动,以增强行程的丰富性。此外,TripCraft还模拟了用户画像,捕捉了旅行风格、预算偏好和地点偏好,以实现更个性化和上下文相关的旅行计划体验。数据集由1000个旅行查询组成,覆盖了140个美国城市的3天、5天和7天行程。金标准计划由25个人工标注者通过多轮细化进行标注,并附有详细说明以增强可解释性,承认每个查询有多种有效的行程计划。
特点
TripCraft数据集的特点在于其高度的现实性和一致性。数据集完全由现实世界的数据源构建,确保了地理一致性,并整合了详细的景点类型、基于用户画像的偏好、活动类别和公共交通信息,使其比先前的基准数据集更加丰富。数据集的行程计划生成具有更高的时空分辨率和结构化的兴趣点排序。为了评估LLM生成的行程计划,数据集引入了五个连续的评估指标,即时间餐点评分、时间景点评分、空间评分、排序评分和用户画像评分,这些指标从多个维度评估行程计划的质量。此外,TripCraft数据集还考虑了用户画像,包括旅行者类型、旅行目的、消费偏好和地点偏好,以确保行程计划与用户偏好相一致。
使用方法
使用TripCraft数据集时,研究人员可以通过提出旅行查询来评估LLM生成的行程计划。查询包括出发城市、目的地、日期范围、预算和用户画像等信息。数据集提供了详细的结构化输入,包括航班、餐厅、景点、住宿、活动、最近的公共交通站点和距离矩阵等信息。研究人员可以使用这些信息来训练和评估LLM模型,以生成符合用户偏好和现实世界约束的行程计划。此外,数据集还提供了五个连续的评估指标,用于评估行程计划的质量,包括时间餐点评分、时间景点评分、空间评分、排序评分和用户画像评分。这些指标可以帮助研究人员更全面地评估LLM模型生成的行程计划,并提供有关行程计划质量的连续和可解释的框架。
背景与挑战
背景概述
TripCraft 数据集由印度理工学院布巴内斯瓦尔分校电气与计算机科学学院和微软印度公司的研究人员共同创建,旨在解决现有旅行规划数据集在现实世界应用中的局限性。该数据集于 2025 年提出,旨在为大型语言模型(LLM)在个性化旅行规划方面的能力提供一个基准。TripCraft 数据集整合了真实世界的约束条件,包括公共交通时刻表、活动可用性、多样化的景点类别和用户画像,以实现更高级别的个性化。该数据集包括 1000 个旅行查询,涵盖 140 个美国城市,并提供 3 天、5 天和 7 天的行程规划。TripCraft 的引入为 LLM 驱动的个性化旅行规划建立了一个新的基准,为行程规划提供了一个更现实、更具约束性的框架。
当前挑战
TripCraft 数据集在解决现有旅行规划数据集的局限性方面面临一些挑战。首先,现有数据集如 TravelPlanner 和 TravelPlanner+ 依赖于半合成数据,导致空间不一致,并且缺乏关键旅行约束,这使得它们在实际行程生成中不够充分。其次,构建 TripCraft 数据集的过程涉及从现实世界数据源中获取数据,并确保地理一致性、有效的交通连接和上下文准确的景点和活动信息。这需要对数据进行仔细的收集和清理,以确保数据的质量和可靠性。最后,评估 LLM 生成的旅行计划是一个挑战,因为现有方法依赖于二进制检查,无法捕捉行程的更细微的细节。为了解决这个问题,TripCraft 提出了五个连续的评估指标,包括时间餐点评分、时间景点评分、空间评分、排序评分和人物评分,这些指标可以从多个维度评估行程质量。
常用场景
经典使用场景
TripCraft数据集被广泛用于评估大型语言模型(LLMs)在生成个性化旅行计划方面的能力。它包含真实世界的旅行数据,包括公共交通时刻表、事件可用性、多样化的景点类别和用户画像,以便更好地模拟现实世界的旅行场景。数据集的设计旨在解决现有数据集在地理一致性、关键旅行约束和个性化方面的不足。TripCraft数据集可用于训练和评估LLMs,使其能够生成符合用户偏好和现实世界约束的旅行计划。此外,数据集还提供了详细的行程计划,包括交通、住宿、餐饮和活动,为LLMs提供了丰富的训练数据。
实际应用
TripCraft数据集在实际应用中具有广泛的应用前景。它可以用于开发智能旅行规划工具,帮助用户生成符合其偏好和现实世界约束的个性化旅行计划。例如,旅行规划应用程序可以利用TripCraft数据集和LLMs来为用户提供基于其旅行偏好、预算和时间的行程建议。此外,TripCraft还可以用于培训旅行顾问,使他们能够更好地理解用户需求并提供更准确和个性化的旅行建议。通过提供真实世界的旅行数据,TripCraft为旅行规划和个性化服务领域的发展做出了重要贡献。
衍生相关工作
TripCraft数据集的引入为LLMs在旅行规划领域的应用开辟了新的研究方向。它为研究人员提供了更真实和丰富的数据集,用于训练和评估LLMs在生成个性化旅行计划方面的能力。此外,TripCraft还提出了五个连续的评估指标,用于评估行程计划的质量,这为LLMs在旅行规划领域的评估提供了新的思路和方法。基于TripCraft数据集,研究人员可以进一步探索LLMs在旅行规划领域的应用,如开发更智能的旅行规划工具、提高LLMs的推理和规划能力以及解决现实世界旅行规划中的挑战。此外,TripCraft数据集还可以用于其他相关领域的研究,如个性化推荐系统、智能决策支持和自然语言生成。通过提供真实世界的旅行数据,TripCraft为LLMs在多个领域的研究和应用提供了重要的基础。
以上内容由遇见数据集搜集并总结生成



