five

DuSQL

收藏
openi.pcl.ac.cn2020-11-01 更新2025-02-08 收录
下载链接:
https://openi.pcl.ac.cn/xiaoxiong/xiaox202302031742568
下载链接
链接失效反馈
资源简介:
DuSQL数据集是一个面向跨领域文本到SQL任务的中文数据集,涵盖了200个数据库、813张表以及23,979对问题与SQL语句。该任务的核心重点在于实际应用,覆盖了164个不同的领域。问题的呈现形式包括匹配、计算和推理等常见类型,与现实应用中遇到的场景高度相似。

DuSQL Dataset is a Chinese dataset for cross-domain text-to-SQL tasks, comprising 200 databases, 813 tables, and 23,979 question-SQL pairs. The core focus of this task is on real-world applications, covering 164 distinct domains. Common question types include matching, calculation and reasoning, which are highly similar to the scenarios encountered in practical applications.
提供机构:
Baidu Inc. et al.
创建时间:
2020-11-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
DuSQL是一个大规模中文多表Text-to-SQL数据集,包含200个数据库覆盖164个领域,问题形式多样(如匹配、计算和推理),旨在模拟真实应用场景,要求模型具备领域无关性和计算推理能力。数据集由22521条训练样本、2482条验证样本和3759条测试样本组成,每条样本包括数据库、自然语言问题和对应的SQL查询语句,适用于中文SQL解析任务的研究与开发。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作