five

mlabonne/chatml_dpo_pairs

收藏
Hugging Face2024-04-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mlabonne/chatml_dpo_pairs
下载链接
链接失效反馈
官方服务:
资源简介:
ChatML DPO Pairs数据集是Intel/orca_dpo_pairs数据集的预处理版本,使用了ChatML格式。该数据集包含来自Open-Orca/OpenOrca的12k个示例,这些示例是基于Orca风格的数据集。数据集的预处理过程包括将系统消息、用户指令、选择的答案和拒绝的答案格式化为ChatML格式。

ChatML DPO Pairs数据集是Intel/orca_dpo_pairs数据集的预处理版本,使用了ChatML格式。该数据集包含来自Open-Orca/OpenOrca的12k个示例,这些示例是基于Orca风格的数据集。数据集的预处理过程包括将系统消息、用户指令、选择的答案和拒绝的答案格式化为ChatML格式。
提供机构:
mlabonne
原始信息汇总

ChatML DPO Pairs 数据集概述

数据集来源

数据内容

预处理方法

  • 预处理代码如下: python def chatml_format(example): # Format system if len(example[system]) > 0: message = {"role": "system", "content": example[system]} system = tokenizer.apply_chat_template([message], tokenize=False) else: system = ""

    # Format instruction
    message = {"role": "user", "content": example[question]}
    prompt = tokenizer.apply_chat_template([message], tokenize=False, add_generation_prompt=True)
    
    # Format chosen answer
    chosen = example[chatgpt] + "<|im_end|>
    

"

  # Format rejected answer
  rejected = example[llama2-13b-chat] + "<|im_end|>

"

  return {
      "prompt": system + prompt,
      "chosen": chosen,
      "rejected": rejected,
  }

Load dataset

dataset = load_dataset("Intel/orca_dpo_pairs")[train]

Save columns

original_columns = dataset.column_names

Tokenizer

tokenizer = AutoTokenizer.from_pretrained("teknium/OpenHermes-2.5-Mistral-7B") tokenizer.pad_token = tokenizer.eos_token tokenizer.padding_side = "left"

Format dataset

dataset = dataset.map( chatml_format, remove_columns=original_columns )

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作