EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format
收藏Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- question-answering
language:
- pt
pretty_name: dataset-portuguese-aira-v2-Gemma-format
tags:
- alignment
- instruction
- chat
size_categories:
- 10K<n<100K
---
<h1 align="center"><font color="red">Dataset Aira para o formato do Modelo Gemma </font></h1>
# <font color="gree">Resumo do Dataset</font>
Este conjunto de dados contém uma coleção de conversas individuais entre um assistente e um usuário.
As conversas foram geradas pelas interações do usuário com modelos já ajustados (`ChatGPT`, `LLama 2`, `Open-Assistant`, etc).
O conjunto de dados está disponível em português (tem a versão em Inglês que ainda não tratei). Mas você pode baixar do
repositório de [Nicholas Kluge Corrêa](https://huggingface.co/datasets/nicholasKluge/instruct-aira-dataset-v2) tanto a versão em Português e
a versão em Inglês.
# <font color="gree">Informações para citação</font>
```latex
@misc{nicholas22aira,
doi = {10.5281/zenodo.6989727},
url = {https://github.com/Nkluge-correa/Aira},
author = {Nicholas Kluge Corrêa},
title = {Aira},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
}
```
Thanks God 🤗!
提供机构:
EddyGiusepe
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 问答
- 语言: 葡萄牙语
- 美观名称: dataset-portuguese-aira-v2-Gemma-format
- 标签: 对齐, 指令, 聊天
- 数据集大小: 10K<n<100K
数据集内容
- 描述: 包含助手与用户之间的个别对话集合。
- 生成方式: 由用户与已调整的模型(如
ChatGPT,LLama 2,Open-Assistant等)的交互生成。 - 语言版本: 提供葡萄牙语版本,英语版本尚未处理。
引用信息
latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, }



