Felladrin/ChatML-distilabel-capybara-dpo-7k-binarized
收藏Hugging Face2024-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Felladrin/ChatML-distilabel-capybara-dpo-7k-binarized
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于问答和文本生成任务的英语数据集,规模在1K到10K之间。数据集已转换为ChatML格式,适用于HuggingFace TRL的DPO Trainer。
该数据集是一个用于问答和文本生成任务的英语数据集,规模在1K到10K之间。数据集已转换为ChatML格式,适用于HuggingFace TRL的DPO Trainer。
提供机构:
Felladrin
原始信息汇总
数据集概述
基本信息
- 许可证: Apache 2.0
- 语言: 英语
- 数据集大小: 1K < n < 10K
- 任务类别:
- 问答
- 文本生成
数据集描述
- 名称: argilla/distilabel-capybara-dpo-7k-binarized
- 格式: ChatML
- 用途: 适用于 HuggingFace TRLs DPO Trainer
数据处理
-
转换代码: python from datasets import load_dataset from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("Felladrin/Llama-160M-Chat-v1")
dataset = load_dataset("argilla/distilabel-capybara-dpo-7k-binarized", split="train")
def format(columns): return { "prompt": tokenizer.apply_chat_template(columns["chosen"][:-1], tokenize=False, add_generation_prompt=True), "chosen": f"{columns[chosen][-1][content]}<|im_end|>", "rejected": f"{columns[rejected][-1][content]}<|im_end|>", }
dataset.map(format).select_columns([prompt, chosen, rejected, source, rating_chosen, rating_rejected, chosen_model, rejected_model]).to_parquet("train.parquet")



