MultiCoXQL, Compass
收藏Compass: 多语言对话式可解释人工智能系统自定义输入提取与解析数据集
数据集概述
Compass是一个多语言数据集,专为对话式可解释人工智能(XAI)系统中的自定义输入提取和解析任务而设计。该数据集支持多种语言,包括中文(cn)、德语(de)、英语(en)、俄语(ru)和泰卢固语(te)。
语言支持
- 中文(cn)
- 德语(de)
- 英语(en)
- 俄语(ru)
- 泰卢固语(te)
数据集结构
数据集分为两个主要部分:
- Compass: 包含实验和数据目录,实验部分涵盖自定义输入提取和意图识别任务
- MultiCoXQL: 包含实验和数据目录,实验部分涉及解析任务,包括引导解码、多提示和多提示增强方法
实验内容
- 自定义输入提取
- 意图识别
- 解析(引导解码、多提示、多提示增强)
相关论文
该数据集相关论文已被EMNLP 2025 Findings接收,标题为《Multilingual Datasets for Custom Input Extraction and Explanation Requests Parsing in Conversational XAI Systems》。
引用信息
bibtex @misc{wang2025multilingualdatasetscustominput, title={Multilingual Datasets for Custom Input Extraction and Explanation Requests Parsing in Conversational XAI Systems}, author={Qianli Wang and Tatiana Anikina and Nils Feldhus and Simon Ostermann and Fedor Splitt and Jiaao Li and Yoana Tsoneva and Sebastian Möller and Vera Schmitt}, year={2025}, eprint={2508.14982}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2508.14982}, }

- 1Multilingual Datasets for Custom Input Extraction and Explanation Requests Parsing in Conversational XAI Systems德国人工智能研究中心(DFKI) · 2025年



