M4-ai/prm_dpo_pairs_cleaned
收藏Hugging Face2024-04-13 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/M4-ai/prm_dpo_pairs_cleaned
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
task_categories:
- text-generation
- question-answering
language:
- en
---
# prm_dpo_pairs_cleaned
## Description
Taken M4-ai/prm_dpo_pairs and extensively cleaned it.
## Filtering technique
- We filtered out any incorrect completions in the chosen field
- We extensively deduplicated around 3,000 examples after filtering out incorrect completions.
The resulting dataset should be able to train a very strong math language model
提供机构:
M4-ai
原始信息汇总
prm_dpo_pairs_cleaned 数据集概述
数据集描述
本数据集基于M4-ai/prm_dpo_pairs,经过深度清理处理。
过滤技术
- 筛选并移除了所选领域中的所有错误完成项。
- 在过滤错误完成项后,对约3,000个示例进行了彻底的去重处理。
预期用途
该数据集旨在用于训练强大的数学语言模型。
许可
数据集遵循Apache-2.0许可协议。
任务类别
- 文本生成
- 问答
语言
数据集主要使用英语。



