CSQA
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/CSQA
下载链接
链接失效反馈官方服务:
资源简介:
包含大约200K对话框,总共1.6M圈。此外,与包含可以从单个元组回答的简单问题的现有大规模QA数据集不同,对话框中的问题需要KG的较大子图。
This dataset contains approximately 200K dialogues, totaling 1.6M conversational turns. Unlike existing large-scale QA datasets that include simple questions answerable through a single knowledge graph triple, the questions in these dialogues require leveraging larger subgraphs of the knowledge graph.
提供机构:
OpenDataLab
创建时间:
2022-06-23
搜集汇总
数据集介绍

背景与挑战
背景概述
CSQA是一个专注于复杂顺序问答的数据集,包含约200K对话框和1.6M圈,旨在模拟基于知识图谱的对话交互。其特点在于问题需要知识图谱的较大子图来回答,区别于简单QA任务,适用于自然语言处理、语义解析和知识图谱相关研究。数据集由IBM Research AI等机构于2018年发布,采用CC BY-SA 4.0许可证。
以上内容由遇见数据集搜集并总结生成



