five

Lambent/synth-rag-general-knowledge-varied-ic

收藏
Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Lambent/synth-rag-general-knowledge-varied-ic
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集通过多种本地模型(7B到2x7B)生成,涵盖了广泛的主题内容。生成过程中使用了修改后的Vodalus-Expert-LLM-Forge工具,该工具被修改为能够生成有趣的JSON角色卡片,并在系统提示中使用这些卡片。此外,生成过程中还添加了随机的‘每日一词’以分散生成向量,并添加了一个‘text’列用于非指令格式的完成训练。

This dataset is generated using multiple local models ranging from 7B to 2x7B, covering a wide range of thematic domains. A modified Vodalus-Expert-LLM-Forge tool was utilized during the generation process; this tool has been adjusted to generate engaging JSON character cards and integrate these cards into system prompts. Furthermore, random "Daily Word" entries were added to diversify the generated embeddings, and a dedicated "text" column was included for fine-tuning on non-instructional text completions.
提供机构:
Lambent
原始信息汇总

数据集概述

数据集生成

  • 模型使用:本地模型,范围从7B到2x7B。
  • 主题范围:涵盖广泛的通用主题。

数据集特点

  • JSON生成:模型被修改以生成JSON格式的角色卡片,用于回答问题并在系统提示中使用。
  • 随机元素添加:包括一个随机的“每日一词”,用于分散生成向量。
  • 文本列添加:增加了一个“文本”列,用于完成训练,该列格式不如指令格式严格。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作