kuotient/reddit_enko_translation_preference
收藏Hugging Face2024-03-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/kuotient/reddit_enko_translation_preference
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为reddit_enko_translation_preference,适用于强化学习人类反馈(RLHF)中的CPO、DPO等方法。数据集包含Reddit上不同子论坛的评论和文章的翻译,其中reject标签使用的是DeepL翻译,chosen标签使用的是GPT4-Turbo翻译。需要注意的是,虽然GPT4的翻译被标记为chosen,但这并不意味着GPT4的翻译一定比DeepL更好,用户应根据自己的需求选择使用。
该数据集名为reddit_enko_translation_preference,适用于强化学习人类反馈(RLHF)中的CPO、DPO等方法。数据集包含Reddit上不同子论坛的评论和文章的翻译,其中reject标签使用的是DeepL翻译,chosen标签使用的是GPT4-Turbo翻译。需要注意的是,虽然GPT4的翻译被标记为chosen,但这并不意味着GPT4的翻译一定比DeepL更好,用户应根据自己的需求选择使用。
提供机构:
kuotient
原始信息汇总
数据集概述
数据集名称
reddit_enko_translation_preference
许可协议
cc-by-nc-sa-4.0
数据规模
1K<n<10K
数据集用途
适用于强化学习中的偏好模型(如CPO, DPO等)。
数据内容
包含Reddit上不同subreddit的评论和文章的翻译。
翻译偏好
- 拒绝使用DeepL翻译。
- 偏好使用GPT4-Turbo翻译。
注意事项
尽管数据集偏好使用GPT4翻译,但并不意味着GPT4的翻译一定比DeepL好。请根据具体需求选择使用。



