HiTZ/ebaluatoia
收藏Hugging Face2025-07-30 更新2025-08-09 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/ebaluatoia
下载链接
链接失效反馈官方服务:
资源简介:
Ebaluatoia 是一个用于评估巴斯克语指令微调语言模型的人类偏好数据集,通过社区驱动的竞技场式评估收集。数据集包含超过 12,000 条来自 1,285 位参与者的偏好注释,这些参与者比较了 21 个不同语言模型的响应。数据集的创建旨在解决巴斯克语等低资源语言在大型语言模型评估方面的资源匮乏问题。参与者根据内容质量和语言质量两个主要维度评估模型响应,并在这些维度冲突时进行整体偏好评估。
Ebaluatoia is a human preference dataset for Basque language models, collected through a community-driven arena-style evaluation. The dataset contains over 12,000 preference annotations from 1,285 participants comparing responses from 21 different language models, including Llama 3.1 variants and the proprietary models GPT-4o and Claude 3.5 Sonnet.
提供机构:
HiTZ



