five

flammenai/Grill-preprod-v2_chatML

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/flammenai/Grill-preprod-v2_chatML
下载链接
链接失效反馈
官方服务:
资源简介:
Grill-v2数据集包含了人类与AI之间以ChatML格式进行的对话,目的是模拟flammen.ai的预生产版本,以训练Mahou系列模型。数据集的模式包括chatID、idx、prompt、chosen和rejected字段。使用SillyTavern作为前端,并设置了特定的ChatML上下文模板和指令模式,以及停止字符串。提示是从Chrome DevTools的网络请求中复制的。

Grill-v2数据集包含了人类与AI之间以ChatML格式进行的对话,目的是模拟flammen.ai的预生产版本,以训练Mahou系列模型。数据集的模式包括chatID、idx、prompt、chosen和rejected字段。使用SillyTavern作为前端,并设置了特定的ChatML上下文模板和指令模式,以及停止字符串。提示是从Chrome DevTools的网络请求中复制的。
提供机构:
flammenai
原始信息汇总

数据集概述

数据集名称

  • Grill-v2

数据集内容

  • 包含ChatML格式的对话,模拟flammen.ai的预生产版本,用于训练Mahou系列模型。

数据集结构

  • chatID:对话索引
  • idx:对话中响应的索引
  • prompt:包含flammen.ai系统提示的ChatML格式对话
  • chosen:接受的响应
  • rejected:被拒绝的响应(用于DPO)

数据集采集方法

  • 使用SillyTavern作为前端,设置包括:
    • ChatML上下文模板
    • 启用ChatML指令模式
    • 使用[<, <|, ]作为停止字符串
  • 通过Chrome DevTools从网络请求中复制提示。
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作