richardr1126/spider-natsql-skeleton-context-instruct
收藏Hugging Face2023-07-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/richardr1126/spider-natsql-skeleton-context-instruct
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于Spider数据集创建的,用于在带有数据库上下文的情况下使用NatSQL对大型语言模型进行微调。Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL数据集,由11名耶鲁学生标注。NatSQL是一种简化SQL查询并减少自然语言与SQL之间不匹配的中间表示,它保留了SQL的核心功能,但删除了一些难以从自然语言描述中推断的条款和关键字。数据集的文本语言为英语,许可信息为CC BY-SA 4.0。
该数据集是基于Spider数据集创建的,用于在带有数据库上下文的情况下使用NatSQL对大型语言模型进行微调。Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL数据集,由11名耶鲁学生标注。NatSQL是一种简化SQL查询并减少自然语言与SQL之间不匹配的中间表示,它保留了SQL的核心功能,但删除了一些难以从自然语言描述中推断的条款和关键字。数据集的文本语言为英语,许可信息为CC BY-SA 4.0。
提供机构:
richardr1126
原始信息汇总
数据集概述
数据集名称
Spider NatSQL Context Instruct
数据集摘要
Spider是一个大规模、复杂且跨领域的语义解析和文本到SQL的数据集,由11名耶鲁大学学生标注。该数据集旨在开发自然语言接口以访问跨领域数据库。本数据集专为在Spider数据集上微调大型语言模型(LLMs),使用NatSQL结合数据库上下文而创建。
NatSQL介绍
NatSQL是一种简化的SQL中间表示,旨在减少自然语言与SQL之间的不匹配。它保留了SQL的核心功能,同时移除了难以从自然语言描述中推断的某些子句和关键字。NatSQL通过减少预测的架构项数量,使得架构链接更加容易,并且可以轻松转换为可执行的SQL查询,从而提高文本到SQL模型的性能。
语言
数据集中的文本为英语。
许可信息
数据集根据CC BY-SA 4.0许可发布。



