five

botbot-ai/aya_dataset_pt

收藏
Hugging Face2024-02-29 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/botbot-ai/aya_dataset_pt
下载链接
链接失效反馈
官方服务:
资源简介:
Aya Dataset是一个多语言指令微调数据集,由Cohere For AI的Aya Annotation Platform通过开放科学社区策划。数据集包含204k个人类注释的提示-完成对,以及注释者的人口统计数据。数据集可用于训练、微调和评估多语言LLMs。数据集由Aya Open Science Intiative的贡献者策划,支持65种语言(包括方言和脚本共71种)。

Aya Dataset是一个多语言指令微调数据集,由Cohere For AI的Aya Annotation Platform通过开放科学社区策划。数据集包含204k个人类注释的提示-完成对,以及注释者的人口统计数据。数据集可用于训练、微调和评估多语言LLMs。数据集由Aya Open Science Intiative的贡献者策划,支持65种语言(包括方言和脚本共71种)。
提供机构:
botbot-ai
原始信息汇总

Aya Dataset Portuguese

概述

Aya Dataset 是一个多语言指令微调数据集,由 Cohere For AI 的 Aya Annotation Platform 通过开放科学社区精心策划。该数据集包含总共 204k 个人工注释的提示-完成对以及注释者的社会人口数据。

语言

  • 原始数据集包含 65 种语言(包括方言和文字共 71 种)。
  • 本数据集是针对葡萄牙语(PT)进行筛选的版本。

许可

  • Apache 2.0

规模

  • 1K<n<10K

标签

  • aya
  • portuguese
  • legal
  • chemistry

用途

该数据集可用于训练、微调和评估多语言大型语言模型(LLMs)。

贡献者

  • Aya Open Science Intiative 的贡献者
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作