five

kuotient/reddit_enko_translation_preference

收藏
Hugging Face2024-03-13 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/kuotient/reddit_enko_translation_preference
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为reddit_enko_translation_preference,适用于强化学习人类反馈(RLHF)中的CPO、DPO等方法。数据集包含Reddit上不同子论坛的评论和文章的翻译,其中reject标签使用的是DeepL翻译,chosen标签使用的是GPT4-Turbo翻译。需要注意的是,虽然GPT4的翻译被标记为chosen,但这并不意味着GPT4的翻译一定比DeepL更好,用户应根据自己的需求选择使用。

该数据集名为reddit_enko_translation_preference,适用于强化学习人类反馈(RLHF)中的CPO、DPO等方法。数据集包含Reddit上不同子论坛的评论和文章的翻译,其中reject标签使用的是DeepL翻译,chosen标签使用的是GPT4-Turbo翻译。需要注意的是,虽然GPT4的翻译被标记为chosen,但这并不意味着GPT4的翻译一定比DeepL更好,用户应根据自己的需求选择使用。
提供机构:
kuotient
原始信息汇总

数据集概述

数据集名称

reddit_enko_translation_preference

许可协议

cc-by-nc-sa-4.0

数据规模

1K<n<10K

数据集用途

适用于强化学习中的偏好模型(如CPO, DPO等)。

数据内容

包含Reddit上不同subreddit的评论和文章的翻译。

翻译偏好

  • 拒绝使用DeepL翻译。
  • 偏好使用GPT4-Turbo翻译。

注意事项

尽管数据集偏好使用GPT4翻译,但并不意味着GPT4的翻译一定比DeepL好。请根据具体需求选择使用。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作