somosnlp/LLM_SQL_BaseDatosEspanol
收藏Hugging Face2024-05-15 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/somosnlp/LLM_SQL_BaseDatosEspanol
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
language:
- es
task_categories:
- question-answering
---
# Dataset Description
- Curated by: [More Information Needed]
Funded by: SomosNLP, HuggingFace, Argilla
Language(s) (NLP): Spanish
License: apache-2.0
# Usos
## Usos directos
El objetivo principal de este dataset es proporcionar ejemplos simples para el fine-tuning de modelos
de procesamiento de lenguaje natural (NLP) en el contexto de consultas SQL.
## Usos fuera de mira
Podria usarse para el entrenamiento de una IA que sirva como creadora de base de datos artificiales
# Estructura del conjunto de datos
- **Question: Es la pegunta que el usuario le dara al chatbot**
- **Answer: La respuesta el que chatbot le deberia de conestar**
- **Context: El contexto de la tabla para obtener mejores resultados**
# Sesgos, riesgos y limitaciones
Esta limitado a el contexto para el que se creo, el cual fue para que pueda obtener el horario de una base de datos escolares enfocado a que un estudiante haga la busqueda
## Recomendaciones
Se pueden agregar mas datos con un contexto diferente para que asi pueda funcionar en diferentes escenarios
# Introducción al Dataset de SQL
El presente dataset proporciona una compilación de datos relacionados con el lenguaje de consulta estructurado
(SQL, por sus siglas en inglés), que es un estándar para el manejo y manipulación de bases de datos relacionales.
Estos datos abarcan consultas de datos para un primer supuesto de un horario de universidad.
提供机构:
somosnlp
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 语言: 西班牙语
- 任务类别: 问答
- 资助方: SomosNLP, HuggingFace, Argilla
数据集用途
- 直接用途: 主要用于为自然语言处理(NLP)模型提供简单的示例,以便在SQL查询的上下文中进行微调。
- 潜在用途: 可用于训练一个能够创建人工数据库的AI。
数据集结构
- Question: 用户向聊天机器人提出的问题。
- Answer: 聊天机器人应回答的答案。
- Context: 用于获取更好结果的表格上下文。
偏差、风险与局限性
- 数据集主要针对特定的创建目的,即帮助学生查询学校数据库的课程表。
建议
- 建议添加更多具有不同上下文的数据,以适应不同的使用场景。



