ko_hh-rlhf-20k_filtered
收藏魔搭社区2025-12-05 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/maywell/ko_hh-rlhf-20k_filtered
下载链接
链接失效反馈官方服务:
资源简介:
# Dataset Card for "ko_hh-rlhf-20k_filtered"
Synatra-Translation 모델로 번역된 20k rlhf셋입니다. 번역퀄이 뛰어나진 않습니다. 추가 대화문 등의 데이터 학습이 필요해보입니다.
## 베이스 데이터셋
[Anthropic/hh-rlhf](https://huggingface.co/datasets/Anthropic/hh-rlhf)
# 「ko_hh-rlhf-20k_filtered」数据集卡片
本数据集为采用Synatra-Translation模型翻译生成的20,000条人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)数据集,整体翻译质量尚有提升空间,后续仍需补充额外对话文本等数据以开展训练优化。
## 基础数据集
[Anthropic/hh-rlhf](https://huggingface.co/datasets/Anthropic/hh-rlhf)
提供机构:
maas
创建时间:
2025-10-13



