botbot-ai/aya_dataset_pt
收藏Hugging Face2024-02-29 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/botbot-ai/aya_dataset_pt
下载链接
链接失效反馈官方服务:
资源简介:
Aya Dataset是一个多语言指令微调数据集,由Cohere For AI的Aya Annotation Platform通过开放科学社区策划。数据集包含204k个人类注释的提示-完成对,以及注释者的人口统计数据。数据集可用于训练、微调和评估多语言LLMs。数据集由Aya Open Science Intiative的贡献者策划,支持65种语言(包括方言和脚本共71种)。
Aya Dataset是一个多语言指令微调数据集,由Cohere For AI的Aya Annotation Platform通过开放科学社区策划。数据集包含204k个人类注释的提示-完成对,以及注释者的人口统计数据。数据集可用于训练、微调和评估多语言LLMs。数据集由Aya Open Science Intiative的贡献者策划,支持65种语言(包括方言和脚本共71种)。
提供机构:
botbot-ai
原始信息汇总
Aya Dataset Portuguese
概述
Aya Dataset 是一个多语言指令微调数据集,由 Cohere For AI 的 Aya Annotation Platform 通过开放科学社区精心策划。该数据集包含总共 204k 个人工注释的提示-完成对以及注释者的社会人口数据。
语言
- 原始数据集包含 65 种语言(包括方言和文字共 71 种)。
- 本数据集是针对葡萄牙语(PT)进行筛选的版本。
许可
- Apache 2.0
规模
- 1K<n<10K
标签
- aya
- portuguese
- legal
- chemistry
用途
该数据集可用于训练、微调和评估多语言大型语言模型(LLMs)。
贡献者
- Aya Open Science Intiative 的贡献者



