LBS-IntentBench
收藏LBS-IntentBench 数据集详情
数据集概述
LBS-IntentBench 是一个基于大规模匿名化真实用户轨迹构建的基准评测集,专门用于评估大语言模型(LLMs)在基于位置服务(LBS)推荐中的隐式意图理解和时空推理能力。
任务结构
数据集采用 意图-决策-事实 层级结构,包含三个互补任务:
| 任务 | 名称 | 描述 | 格式 |
|---|---|---|---|
| Task 1 | 移动意图推理(MII) | 根据用户画像、行为历史和时空上下文,对候选意图场景进行可能性排序 | 排序 |
| Task 2 | 上下文约束推理(CCI) | 根据画像、历史和时空上下文,从候选中识别行为约束和决策逻辑 | 多项选择 |
| Task 3 | 通用移动任务(GMT) | 包含7个子任务,涵盖POI理解、轨迹检索、下一步预测、偏好总结等 | 问答/多项选择 |
7个子任务(Task 3 GMT)
- POI语义理解
- 轨迹事实检索
- 下一步移动预测
- 位置时间推理
- 移动偏好总结
- 移动原因推理
- 反事实异常检测
项目结构
LBS-IntentBench/ ├── data/ # 数据集文件 │ ├── task1_mii/ │ │ └── mobility_intent_inference.csv │ ├── task2_cci/ │ │ └── contextual_constraint_inference.csv │ └── task3_gmt/ # 7个CSV子任务文件 │ ├── poi_semantic_understanding.csv │ ├── trajectory_fact_retrieval.csv │ ├── next_step_mobility_prediction.csv │ ├── location_time_reasoning.csv │ ├── mobility_preference_summarization.csv │ ├── mobility_reason_inference.csv │ └── counterfactual_anomaly_detection.csv ├── prompts/ # 提示模板 │ ├── task1_mii/ # 内部审核后发布 │ ├── task2_cci/ # 内部审核后发布 │ └── task3_gmt/ # 8个JSON提示文件 ├── evaluation/ # 评估脚本 │ ├── task1_mii.py # 内部审核后发布 │ ├── task2_cci.py # 内部审核后发布 │ └── task3_gmt/ # 7个子任务评估脚本(已全部公开) ├── scripts/ │ └── run_evaluation.py # 统一评估入口(当前仅支持Task 3) └── docs/ └── metrics.md # 文档
评估说明
- Task 3(GMT)的评估脚本已全部公开,可使用
scripts/run_evaluation.py进行统一评估 - 评估时需要提供模型预测结果(JSONL格式)和对应的真实标签数据(CSV格式)
- Task 1(MII)和Task 2(CCI)的评估脚本将在内部审核后发布
- POI语义理解子任务需要指定
--direction参数(forward 或 backward),其他子任务无需此参数
许可协议
本项目采用 Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0) 许可协议。




