five

GenRM/reddit-dpo-nbeerbower

收藏
Hugging Face2025-05-11 更新2025-11-01 收录
下载链接:
https://hf-mirror.com/datasets/GenRM/reddit-dpo-nbeerbower
下载链接
链接失效反馈
官方服务:
资源简介:
reddit-dpo数据集是从euclaise/reddit-instruct数据集过滤而来的,去除了所有帖子或评论中包含超链接的样本。该数据集用于模型训练,特别是用于调整mistral-nemo-narwhal-12B模型,但调整后的模型性能有所下降。

The reddit-dpo dataset is filtered from the euclaise/reddit-instruct dataset, removing all samples with hyperlinks in either the post or comment. This dataset is used for model training, particularly for tuning the mistral-nemo-narwhal-12B model, which experienced a significant performance degradation after tuning.
提供机构:
GenRM
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作