five

CANARD

收藏
arXiv2025-09-30 收录
下载链接:
https://sites.google.com/view/qanta/projects/canard
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为CANARD,它将QuAC中的问题转换为自包含式问题,使得这些问题无需依赖对话上下文即可被理解。此外,该数据集还作为生成R-CANARD数据集中后续问题的基础,其任务领域为问题理解。

This dataset is named CANARD. It converts questions from the QuAC dataset into self-contained questions, enabling them to be understood independently of conversational context. Furthermore, it serves as the foundation for generating follow-up questions in the R-CANARD dataset, and its task domain focuses on question understanding.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CANARD是一个用于上下文问题重写的数据集,包含40,527个问题,每个问题都提供对话上下文和上下文无关的重写版本,旨在评估处理指代和省略等语言现象的重写模型。数据集基于QuAC构建,通过众包收集,并分为训练、开发和测试集,使用CC BY-SA 4.0许可证发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作