llmsql-2.0-fine-tune-ready

Hugging Face2026-02-11 更新2026-02-12 收录

下载链接：

https://huggingface.co/datasets/llmsql-bench/llmsql-2.0-fine-tune-ready

下载链接

链接失效反馈

官方服务：

资源简介：

LLMSQL Benchmark 2.0 (Finetune-Ready) 是一个专为评估文本到SQL模型设计的基准数据集。该数据集以适合指令调优模型的消息格式构建，每个示例包含一个`messages`字段，该字段是一个字典列表，其中包含用户角色（输入问题或提示）和助手角色（预期的SQL查询）。数据集分为三个基于示例数量的子集：0shot（零样本）、1shot（单样本）和5shot（五样本），每个子集均包含训练集、验证集和测试集。数据集以Hugging Face格式存储，可通过`load_dataset`函数加载。适用于文本到SQL转换任务的研究和评估。

创建时间：

2026-02-07

原始信息汇总

LLMSQL Benchmark 2.0 (Finetune-Ready) 数据集概述

数据集基本信息

数据集名称: LLMSQL Benchmark 2.0 (Finetune-Ready)
托管地址: https://huggingface.co/datasets/llmsql-bench/llmsql-2.0-fine-tune-ready
主要用途: 评估文本到SQL模型
许可协议: MIT
主要语言: 英语 (en)
相关标签: text-to-sql, benchmark, evaluation

数据集描述

该数据集是LLMSQL基准测试的微调就绪版本，原始基准测试为LLMSQL 2.0 on Hugging Face。数据集采用适合指令调优模型的消息格式进行结构化，每个示例包含一个messages字段。该字段是一个字典列表，包含：

"role": "user" — 输入问题或提示
"role": "assistant" — 期望的SQL查询

数据集配置与结构

数据集按不同示例数量（shot）组织为三个子集，每个子集均包含训练集、验证集和测试集。

可用配置

0shot
- 描述: 零样本示例
- 数据文件:
  - 验证集: 0shot/validation*.parquet
  - 训练集: 0shot/train*.parquet
  - 测试集: 0shot/test*.parquet
1shot
- 描述: 单样本示例
- 数据文件:
  - 验证集: 1shot/validation*.parquet
  - 训练集: 1shot/train*.parquet
  - 测试集: 1shot/test*.parquet
5shot (默认配置)
- 描述: 五样本示例
- 数据文件:
  - 验证集: 5shot/validation*.parquet
  - 训练集: 5shot/train*.parquet
  - 测试集: 5shot/test*.parquet

数据加载方式

每个子集文件夹包含以Hugging Face格式保存的DatasetDict，可使用以下代码加载： python from datasets import load_dataset ds = load_dataset("llmsql-bench/llmsql-2.0-fine-tune-ready", name="1shot")

引用信息

若使用此基准测试，请引用：

@inproceedings{llmsql_bench, title={LLMSQL: Upgrading WikiSQL for the LLM Era of Text-to-SQL}, author={Pihulski, Dzmitry and Charchut, Karol and Novogrodskaia, Viktoria and Koco{n}, Jan}, booktitle={2025 IEEE International Conference on Data Mining Workshops (ICDMW)}, year={2025}, organization={IEEE} }

搜集汇总

数据集介绍

构建方式

在文本到SQL转换领域，LLMSQL 2.0数据集的构建体现了对传统基准的现代化升级。该数据集以WikiSQL为基础，通过精心设计的数据转换流程，将原始的自然语言问题与对应的SQL查询重新组织为适合指令调优模型的消息格式。每个数据样本均被结构化为包含用户角色和助手角色的对话序列，其中用户部分呈现问题描述，助手部分则提供标准SQL查询，从而直接适配当前大语言模型的微调需求。

特点

该数据集的核心特征在于其多层次的任务配置设计，专门针对不同上下文学习场景提供了零样本、单样本和五样本三种子集。每个子集均包含训练、验证和测试的标准划分，确保了模型评估的严谨性与可复现性。数据以Parquet格式存储，并采用Hugging Face数据集库的标准结构，便于研究者直接加载与使用。这种设计不仅支持模型在少样本情境下的性能测评，也为系统化的微调实验提供了坚实基础。

使用方法

研究者可通过Hugging Face的datasets库便捷地访问该数据集，指定对应的子集名称即可加载相应配置。例如，调用load_dataset函数并传入数据集标识与子集参数，能够获取结构化的DatasetDict对象，进而开展模型训练或评估。数据集中每条记录的消息字段可直接输入至指令微调框架，模拟真实的对话交互过程，为文本到SQL任务的模型开发与基准测试提供了高效、标准化的实验平台。

背景与挑战

背景概述

在自然语言处理领域，文本到结构化查询语言（Text-to-SQL）的转换任务旨在将用户以自然语言表述的信息需求，自动转化为可执行的数据库查询语句，从而降低非专业用户与数据库交互的技术门槛。LLMSQL 2.0 数据集由 Pihulski, Dzmitry 等研究人员于2025年构建，作为WikiSQL数据集的升级版本，其核心研究问题是评估大语言模型时代下文本到SQL模型的性能。该数据集通过提供零样本、单样本及多样本等不同配置，旨在系统性地衡量模型在少样本学习场景下的泛化能力与推理准确性，对推动对话式数据库接口及智能数据检索系统的发展具有显著影响力。

当前挑战

该数据集致力于解决文本到SQL转换领域的核心挑战，即如何准确理解复杂的自然语言语义并将其映射为语法正确、逻辑等效的SQL查询，尤其是在面对数据库模式多样、查询嵌套及多表联接等复杂场景时，模型需具备强大的语义解析与结构化生成能力。在构建过程中，挑战主要集中于数据集的升级与适配工作，包括将原始的WikiSQL数据重构为适用于指令微调模型的对话格式，确保每个示例包含清晰的角色划分信息；同时，设计并整合不同样本数量的子集以支持系统的少样本评估，这要求数据标注具备高度的一致性与逻辑严谨性，以避免引入偏差并保证评估结果的可靠性。

常用场景

经典使用场景

在自然语言处理领域，文本到SQL转换任务旨在将用户自然语言查询自动转化为结构化查询语言，以直接操作数据库。LLMSQL-2.0-fine-tune-ready数据集通过提供精心构造的指令微调格式，成为评估和训练文本到SQL模型的核心基准。其经典使用场景包括模型在零样本、少样本及微调设置下的性能评测，研究人员利用该数据集划分的不同样本数量子集，系统检验模型从自然语言中理解语义并生成准确SQL语句的能力，从而推动对话式数据库接口的技术演进。

实际应用

在实际应用层面，LLMSQL-2.0-fine-tune-ready数据集支撑了智能数据查询系统的开发与优化。基于该数据集训练的模型可部署于商业智能平台、客户服务自动化及企业内部数据管理系统，允许非技术用户通过自然语言直接检索数据库信息，大幅降低数据访问门槛。例如，在金融分析或医疗数据管理中，系统能够快速理解用户意图并生成精确查询，提升决策效率与操作便捷性，体现了人工智能技术赋能行业数字化转型的实用价值。

衍生相关工作

围绕该数据集，已衍生出一系列经典研究工作，主要集中在文本到SQL模型的架构创新与训练策略上。例如，研究者利用其少样本子集探索提示工程与上下文学习方法的有效性，或在微调子集上开发基于大型语言模型的专用适配器。这些工作不仅提升了模型在复杂查询上的准确率，还推动了跨领域迁移学习与多任务学习框架的发展，为后续更高效、可扩展的语义解析系统奠定了坚实理论基础。

以上内容由遇见数据集搜集并总结生成