re-align/rdpo-feedbacks
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/re-align/rdpo-feedbacks
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: tulu-2-dpo-7b
data_files:
- split: train_prefs
path: "lmsys-chat-fitlered_hard_n=8+tulu-2-dpo-7b.jsonl"
- config_name: zephyr-7b-beta
data_files:
- split: train_prefs
path: "lmsys-chat-fitlered_hard_n=8+zephyr-7b-beta.jsonl"
- config_name: yi-6b-chat
data_files:
- split: train_prefs
path: "lmsys_hard.n=8+Yi-6B-Chat.jsonl"
---
提供机构:
re-align
原始信息汇总
数据集配置详情
配置一:tulu-2-dpo-7b
- 数据文件:
- 分割: train_prefs
- 路径: lmsys-chat-fitlered_hard_n=8+tulu-2-dpo-7b.jsonl
配置二:zephyr-7b-beta
- 数据文件:
- 分割: train_prefs
- 路径: lmsys-chat-fitlered_hard_n=8+zephyr-7b-beta.jsonl
配置三:yi-6b-chat
- 数据文件:
- 分割: train_prefs
- 路径: lmsys_hard.n=8+Yi-6B-Chat.jsonl



