five

Magpie-Align/Magpie-Air-MT-300K-v0.1

收藏
Hugging Face2024-07-03 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/Magpie-Align/Magpie-Air-MT-300K-v0.1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过Magpie方法从Llama 3 8B Instruct模型中生成的,包含了300K高质量的多轮对话数据。数据集的过滤条件包括输入质量、输入难度、奖励差异等,并且去除了重复和不完整的指令。数据集的结构包括模型名称、输入配置、对话内容等字段。

This dataset is generated by Llama 3 8B Instruct using the Magpie method, containing 300K high-quality multi-turn conversation data. The filtering conditions for the dataset include input quality, input difficulty, reward difference, etc., and remove repetitive and incomplete instructions. The structure of the dataset includes fields such as model name, input configuration, conversation content, etc.
提供机构:
Magpie-Align
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • model: 模型名称,类型为字符串。
    • gen_input_config: 生成输入配置,包含以下子字段:
      • temperature: 温度参数,类型为浮点数。
      • top_p: 采样概率参数,类型为浮点数。
    • input1: 输入1,类型为字符串。
    • output1: 输出1,类型为字符串。
    • input2: 输入2,类型为字符串。
    • output2: 输出2,类型为字符串。
    • conversations: 对话列表,包含以下子字段:
      • from: 对话来源,类型为字符串。
      • value: 对话内容,类型为字符串。
    • uuid: 唯一标识符,类型为字符串。
  • 分割:

    • train: 训练集,包含300,000个样本,总大小为3,714,318,522字节。
  • 下载大小: 1,946,163,678字节。

  • 数据集大小: 3,714,318,522字节。

配置

  • 默认配置:
    • data_files:
      • train: 训练集文件路径为data/train-*

过滤设置

  • 输入质量: ≥ 良好
  • 输入难度: ≥ 中等
  • 奖励差异: ≥ 0
  • 移除重复和不完整的指令(例如以冒号结尾的指令)
  • 选择300K个具有最长响应的数据

数据集导航

模型名称 数据集 类型 描述
Llama 3 70B Instruct Magpie-Pro-1M SFT 使用Meta Llama 3 70B构建的1M原始对话。
Llama 3 70B Instruct Magpie-Pro-300K-Filtered SFT 应用过滤器并选择300K高质量对话。
Llama 3 70B Instruct Magpie-Pro-MT-300K SFT 选择300K困难问题并扩展为多轮对话。
Llama 3 8B Instruct Magpie-Air-3M SFT 使用Meta Llama 3 8B构建的3M原始对话。
Llama 3 8B Instruct Magpie-Air-300K-Filtered SFT 应用过滤器并选择300K高质量数据。
Llama 3 8B Instruct Magpie-Air-MT-300K SFT 选择300K困难问题并扩展为多轮对话。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作