five

flammenai/Grill-preprod-v1_chatML

收藏
Hugging Face2024-05-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/flammenai/Grill-preprod-v1_chatML
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含ChatML格式的人类与AI之间的对话,目的是模拟flammen.ai的预生产版本以训练Mahou系列模型。数据集的模式包括chatID(对话链接索引)、idx(对话中的响应索引)、prompt(包括flammen.ai系统提示的ChatML格式对话)、chosen(接受的响应)和rejected(用于DPO的拒绝响应)。使用SillyTavern作为前端,设置了ChatML上下文模板、启用了ChatML指令模式,并使用特定的停止字符串。提示是从使用Chrome DevTools的网络请求中复制的。

该数据集包含ChatML格式的人类与AI之间的对话,目的是模拟flammen.ai的预生产版本以训练Mahou系列模型。数据集的模式包括chatID(对话链接索引)、idx(对话中的响应索引)、prompt(包括flammen.ai系统提示的ChatML格式对话)、chosen(接受的响应)和rejected(用于DPO的拒绝响应)。使用SillyTavern作为前端,设置了ChatML上下文模板、启用了ChatML指令模式,并使用特定的停止字符串。提示是从使用Chrome DevTools的网络请求中复制的。
提供机构:
flammenai
原始信息汇总

Grill-v1 数据集概述

数据集描述

  • 目标:该数据集包含人类与AI之间的ChatML格式对话,旨在模拟flammen.ai的预生产版本,以训练Mahou系列模型。

数据结构

  • chatID:对话的索引链接。
  • idx:对话中响应的索引。
  • prompt:包含flammen.ai系统提示的ChatML格式对话。
  • chosen:接受的响应。
  • rejected:被拒绝的响应(用于DPO)。

采集方法

  • 前端工具:使用SillyTavern作为前端,配置如下:
    • 启用ChatML上下文模板。
    • 启用ChatML指令模式。
    • 使用[<, <|, ]作为停止字符串。
  • 数据获取:通过Chrome DevTools从网络请求中复制提示。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作