five

OpenLLM-Ro/ro_dpo_ultrafeedback

收藏
Hugging Face2025-04-22 更新2025-05-31 收录
下载链接:
https://hf-mirror.com/datasets/OpenLLM-Ro/ro_dpo_ultrafeedback
下载链接
链接失效反馈
官方服务:
资源简介:
UltraFeedback数据集包含6万条偏好数据,这是通过GPT-4o mini模型翻译成罗马尼亚语的版本。该数据集是为了罗马尼亚语言模型的对齐协议的下一步而创建的,用于训练具有英语指令的强大罗马尼亚语言模型。

The UltraFeedback dataset contains 60k preference data. This is the Romanian translation of the dataset, translated with GPT-4o mini. It represents a next step in the alignment protocol for Romanian LLMs, proposed in the paper Vorbești Românește? A Recipe to Train Powerful Romanian LLMs with English Instructions.
提供机构:
OpenLLM-Ro
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作