five

EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format

收藏
Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/EddyGiusepe/dataset-portuguese-aira-v2-Gemma-format
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - question-answering language: - pt pretty_name: dataset-portuguese-aira-v2-Gemma-format tags: - alignment - instruction - chat size_categories: - 10K<n<100K --- <h1 align="center"><font color="red">Dataset Aira para o formato do Modelo Gemma </font></h1> # <font color="gree">Resumo do Dataset</font> Este conjunto de dados contém uma coleção de conversas individuais entre um assistente e um usuário. As conversas foram geradas pelas interações do usuário com modelos já ajustados (`ChatGPT`, `LLama 2`, `Open-Assistant`, etc). O conjunto de dados está disponível em português (tem a versão em Inglês que ainda não tratei). Mas você pode baixar do repositório de [Nicholas Kluge Corrêa](https://huggingface.co/datasets/nicholasKluge/instruct-aira-dataset-v2) tanto a versão em Português e a versão em Inglês. # <font color="gree">Informações para citação</font> ```latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, } ``` Thanks God 🤗!
提供机构:
EddyGiusepe
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 问答
  • 语言: 葡萄牙语
  • 美观名称: dataset-portuguese-aira-v2-Gemma-format
  • 标签: 对齐, 指令, 聊天
  • 数据集大小: 10K<n<100K

数据集内容

  • 描述: 包含助手与用户之间的个别对话集合。
  • 生成方式: 由用户与已调整的模型(如ChatGPT, LLama 2, Open-Assistant等)的交互生成。
  • 语言版本: 提供葡萄牙语版本,英语版本尚未处理。

引用信息

latex @misc{nicholas22aira, doi = {10.5281/zenodo.6989727}, url = {https://github.com/Nkluge-correa/Aira}, author = {Nicholas Kluge Corrêa}, title = {Aira}, year = {2023}, publisher = {GitHub}, journal = {GitHub repository}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作