OpenLLM-Ro/ro_dpo_ultrafeedback
收藏Hugging Face2025-04-22 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/OpenLLM-Ro/ro_dpo_ultrafeedback
下载链接
链接失效反馈官方服务:
资源简介:
UltraFeedback数据集包含6万条偏好数据,这是通过GPT-4o mini模型翻译成罗马尼亚语的版本。该数据集是为了罗马尼亚语言模型的对齐协议的下一步而创建的,用于训练具有英语指令的强大罗马尼亚语言模型。
The UltraFeedback dataset contains 60k preference data. This is the Romanian translation of the dataset, translated with GPT-4o mini. It represents a next step in the alignment protocol for Romanian LLMs, proposed in the paper Vorbești Românește? A Recipe to Train Powerful Romanian LLMs with English Instructions.
提供机构:
OpenLLM-Ro



