five

richardr1126/spider-natsql-skeleton-context-instruct

收藏
Hugging Face2023-07-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/richardr1126/spider-natsql-skeleton-context-instruct
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是基于Spider数据集创建的,用于在带有数据库上下文的情况下使用NatSQL对大型语言模型进行微调。Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL数据集,由11名耶鲁学生标注。NatSQL是一种简化SQL查询并减少自然语言与SQL之间不匹配的中间表示,它保留了SQL的核心功能,但删除了一些难以从自然语言描述中推断的条款和关键字。数据集的文本语言为英语,许可信息为CC BY-SA 4.0。

该数据集是基于Spider数据集创建的,用于在带有数据库上下文的情况下使用NatSQL对大型语言模型进行微调。Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL数据集,由11名耶鲁学生标注。NatSQL是一种简化SQL查询并减少自然语言与SQL之间不匹配的中间表示,它保留了SQL的核心功能,但删除了一些难以从自然语言描述中推断的条款和关键字。数据集的文本语言为英语,许可信息为CC BY-SA 4.0。
提供机构:
richardr1126
原始信息汇总

数据集概述

数据集名称

Spider NatSQL Context Instruct

数据集摘要

Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL的数据集,由11名耶鲁大学学生标注。该数据集旨在开发自然语言接口以访问跨领域数据库。本数据集专为在Spider数据集上微调大型语言模型(LLMs),使用NatSQL结合数据库上下文而创建。

NatSQL介绍

NatSQL是一种简化的SQL中间表示,旨在减少自然语言与SQL之间的不匹配。它保留了SQL的核心功能,同时移除了难以从自然语言描述中推断的某些子句和关键字。NatSQL通过减少预测的架构项数量,使得架构链接更加容易,并且可以轻松转换为可执行的SQL查询,从而提高文本到SQL模型的性能。

语言

数据集中的文本为英语。

许可信息

数据集根据CC BY-SA 4.0许可发布。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作