five

allenai/tulu-3-wildchat-reused-on-policy-70b

收藏
Hugging Face2024-11-21 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/allenai/tulu-3-wildchat-reused-on-policy-70b
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个偏好数据集,属于Tulu 3偏好混合数据集的一部分。它包含了来自WildChat的提示,并包含了17,207个生成对,其中一些生成对是使用Llama-3.1-Tulu-3-70B模型生成的。数据集使用了多个模型生成内容,包括Mistral、Tulu、Yi、MPT、Google Gemma、InternLM、Falcon、Qwen、Llama、GPT-4和Claude等模型。生成方法结合了策略内和策略外数据,并使用Ultrafeedback模板和LLM法官对四个不同方面进行了偏好注释。数据集遵循ODC-BY许可,适用于研究和教育用途。

This preference dataset is part of the Tulu 3 preference mixture, containing prompts from WildChat and 17,207 generation pairs. These results were generated using various models including Mistral, Tulu, Yi, MPT, Google Gemma, InternLM, Falcon, Qwen, Llama, and GPT-4. The generation process combines on-policy and off-policy data, and uses the Ultrafeedback template and LLM judgment for preference annotation. The dataset is licensed under ODC-BY, intended for research and educational use.
提供机构:
allenai
二维码
社区交流群
二维码
科研交流群
商业服务