Felladrin/ChatML-distilabel-capybara-dpo-7k-binarized

Name: Felladrin/ChatML-distilabel-capybara-dpo-7k-binarized
Creator: Felladrin
Published: 2024-02-23 18:06:17
License: 暂无描述

Hugging Face2024-02-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Felladrin/ChatML-distilabel-capybara-dpo-7k-binarized

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于问答和文本生成任务的英语数据集，规模在1K到10K之间。数据集已转换为ChatML格式，适用于HuggingFace TRL的DPO Trainer。

提供机构：

Felladrin

原始信息汇总

数据集概述

转换代码: python from datasets import load_dataset from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("Felladrin/Llama-160M-Chat-v1")

dataset = load_dataset("argilla/distilabel-capybara-dpo-7k-binarized", split="train")

def format(columns): return { "prompt": tokenizer.apply_chat_template(columns["chosen"][:-1], tokenize=False, add_generation_prompt=True), "chosen": f"{columns[chosen][-1][content]}<|im_end|>", "rejected": f"{columns[rejected][-1][content]}<|im_end|>", }

dataset.map(format).select_columns([prompt, chosen, rejected, source, rating_chosen, rating_rejected, chosen_model, rejected_model]).to_parquet("train.parquet")

5,000+

优质数据集

54 个

任务类型

进入经典数据集