EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format

Name: EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format
Creator: EddyGiusepe
Published: 2024-04-12 05:06:16
License: 暂无描述

Hugging Face2024-04-12 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: apache-2.0 task_categories: - question-answering language: - pt pretty_name: dataset-portuguese-aira-v2-Gemma-format tags: - alignment - instruction - chat size_categories: - 10K<n<100K --- <h1 align="center"><font color="red">Dataset Aira para o formato do Modelo Gemma </font></h1> # <font color="gree">Resumo do Dataset</font> Este conjunto de dados contém uma coleção de conversas individuais entre um assistente e um usuário. As conversas foram geradas pelas interações do usuário com modelos já ajustados (`ChatGPT`, `LLama 2`, `Open-Assistant`, etc). O conjunto de dados está disponível em português (tem a versão em Inglês que ainda não tratei). Mas você pode baixar do repositório de [Nicholas Kluge Corrêa](https://huggingface.co/datasets/nicholasKluge/instruct-aira-dataset-v2) tanto a versão em Português e a versão em Inglês. # <font color="gree">Informações para citação</font> ```latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, } ``` Thanks God 🤗!

提供机构：

EddyGiusepe

原始信息汇总

数据集概述

基本信息

许可证: Apache-2.0
任务类别: 问答
语言: 葡萄牙语
美观名称: dataset-portuguese-aira-v2-Gemma-format
标签: 对齐, 指令, 聊天
数据集大小: 10K<n<100K

数据集内容

描述: 包含助手与用户之间的个别对话集合。
生成方式: 由用户与已调整的模型（如ChatGPT, LLama 2, Open-Assistant等）的交互生成。
语言版本: 提供葡萄牙语版本，英语版本尚未处理。

引用信息

latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, }

5,000+

优质数据集

54 个

任务类型

进入经典数据集