ChinaTravel
收藏ChinaTravel 数据集概述
数据集简介
ChinaTravel是一个面向中文旅行规划的语言代理的实时世界基准数据集。
数据集相关信息
- 数据集名称:ChinaTravel
- 数据集用途:用于评估语言代理在中文旅行规划任务中的表现
- 论文链接:arXiv
- 数据集下载:
快速开始
环境设置
-
创建conda环境并安装依赖: bash conda create -n chinatravel python=3.9
conda activate chinatravel
pip install -r requirements.txt -
下载数据库并解压到
chinatravel/environment/目录下载链接:Google Drive, NJU Drive
运行示例
支持deepseek、gpt-4o、glm4-plus以及使用qwen进行本地推理。
bash export OPENAI_API_KEY=""
python run_exp.py --splits easy --agent LLMNeSy --llm deepseek --oracle_translation python run_exp.py --splits medium --agent LLMNeSy --llm deepseek --oracle_translation python run_exp.py --splits human --agent LLMNeSy --llm deepseek --oracle_translation
python run_exp.py --splits human --agent LLMNeSy --llm deepseek
评估
bash python eval_exp.py --splits human --method LLMNeSy_deepseek_oracletranslation python eval_exp.py --splits human --method LLMNeSy_deepseek
文档
联系方式
- 如果有任何问题,请联系:
- Jie-Jing Shao (shaojj@lamda.nju.edu.cn)
- Bo-Wen Zhang (221900200@smail.nju.edu.cn)
- Xiao-Wen Yang (yangxw@lamda.nju.edu.cn)
引用
@misc{shao2024chinatravelrealworldbenchmarklanguage, title={ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning}, author={Jie-Jing Shao and Xiao-Wen Yang and Bo-Wen Zhang and Baizhi Chen and Wen-Da Wei and Guohao Cai and Zhenhua Dong and Lan-Zhe Guo and Yu-feng Li}, year={2024}, eprint={2412.13682}, archivePrefix={arXiv}, primaryClass={cs.AI}, url={https://arxiv.org/abs/2412.13682}, }




