somosnlp/LLM_SQL_BaseDatosEspanol

Name: somosnlp/LLM_SQL_BaseDatosEspanol
Creator: somosnlp
Published: 2024-05-15 17:59:20
License: 暂无描述

Hugging Face2024-05-15 更新2024-04-19 收录

下载链接：

https://hf-mirror.com/datasets/somosnlp/LLM_SQL_BaseDatosEspanol

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 language: - es task_categories: - question-answering --- # Dataset Description - Curated by: [More Information Needed] Funded by: SomosNLP, HuggingFace, Argilla Language(s) (NLP): Spanish License: apache-2.0 # Usos ## Usos directos El objetivo principal de este dataset es proporcionar ejemplos simples para el fine-tuning de modelos de procesamiento de lenguaje natural (NLP) en el contexto de consultas SQL. ## Usos fuera de mira Podria usarse para el entrenamiento de una IA que sirva como creadora de base de datos artificiales # Estructura del conjunto de datos - **Question: Es la pegunta que el usuario le dara al chatbot** - **Answer: La respuesta el que chatbot le deberia de conestar** - **Context: El contexto de la tabla para obtener mejores resultados** # Sesgos, riesgos y limitaciones Esta limitado a el contexto para el que se creo, el cual fue para que pueda obtener el horario de una base de datos escolares enfocado a que un estudiante haga la busqueda ## Recomendaciones Se pueden agregar mas datos con un contexto diferente para que asi pueda funcionar en diferentes escenarios # Introducción al Dataset de SQL El presente dataset proporciona una compilación de datos relacionados con el lenguaje de consulta estructurado (SQL, por sus siglas en inglés), que es un estándar para el manejo y manipulación de bases de datos relacionales. Estos datos abarcan consultas de datos para un primer supuesto de un horario de universidad.

提供机构：

somosnlp

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
语言: 西班牙语
任务类别: 问答
资助方: SomosNLP, HuggingFace, Argilla

数据集用途

直接用途: 主要用于为自然语言处理（NLP）模型提供简单的示例，以便在SQL查询的上下文中进行微调。
潜在用途: 可用于训练一个能够创建人工数据库的AI。

数据集结构

Question: 用户向聊天机器人提出的问题。
Answer: 聊天机器人应回答的答案。
Context: 用于获取更好结果的表格上下文。

偏差、风险与局限性

数据集主要针对特定的创建目的，即帮助学生查询学校数据库的课程表。

建议

建议添加更多具有不同上下文的数据，以适应不同的使用场景。

5,000+

优质数据集

54 个

任务类型

进入经典数据集