Henok/aya_amharic_dataset
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Henok/aya_amharic_dataset
下载链接
链接失效反馈官方服务:
资源简介:
AYA Amharic Dataset是从AYA数据集中提取的阿姆哈拉语部分。AYA数据集是一个多语言指令微调数据集,包含204k个人工标注的提示-完成对以及标注者的人口统计数据。数据集可用于训练、微调和评估多语言大语言模型。数据集的创建是通过Aya Annotation Platform由开放科学社区的贡献者完成的,涵盖了65种语言(包括方言和脚本)。数据集包含两种类型的数据:人工标注和人口统计数据。人工标注包括原始标注和重新标注,人口统计数据则是每个标注者的匿名信息。数据集的使用遵循Apache 2.0许可证。
AYA Amharic Dataset是从AYA数据集中提取的阿姆哈拉语部分。AYA数据集是一个多语言指令微调数据集,包含204k个人工标注的提示-完成对以及标注者的人口统计数据。数据集可用于训练、微调和评估多语言大语言模型。数据集的创建是通过Aya Annotation Platform由开放科学社区的贡献者完成的,涵盖了65种语言(包括方言和脚本)。数据集包含两种类型的数据:人工标注和人口统计数据。人工标注包括原始标注和重新标注,人口统计数据则是每个标注者的匿名信息。数据集的使用遵循Apache 2.0许可证。
提供机构:
Henok



