five

Heralax/Augmentoolkit-demo

收藏
Hugging Face2024-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Heralax/Augmentoolkit-demo
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用Augmentoolkit工具和一些Project Gutenberg的书籍生成的,主要用于AI角色扮演(AI RP)模式。数据集包含了多种书籍,如《化学原理》、《战争论》、《简单破坏》等,旨在测试Augmentoolkit处理不同类型文本的能力。数据集可用于微调模型,并鼓励用户尝试使用高LoRA rank以提高模型学习效果。

该数据集是使用Augmentoolkit工具和一些Project Gutenberg的书籍生成的,主要用于AI角色扮演(AI RP)模式。数据集包含了多种书籍,如《化学原理》、《战争论》、《简单破坏》等,旨在测试Augmentoolkit处理不同类型文本的能力。数据集可用于微调模型,并鼓励用户尝试使用高LoRA rank以提高模型学习效果。
提供机构:
Heralax
原始信息汇总

数据集概述

数据集来源

数据集内容

  • 数据集包含多种类型的书籍和手册,包括:
    • Principles of Chemistry by Demitry Mendeleev
    • On Liberty by John Stuart Mill
    • On War by Carl von Clausewitz
    • Simple Sabotage by the Office of Strategic Services
    • Introduction to Logic and Critical Thinking by Matthew Van Cleave

数据集用途

  • 该数据集主要用于测试和实验,特别是用于测试Augmentoolkit如何处理不同类型的文本。
  • 可以用于微调模型,特别是通过使用高LoRA排名来确保模型学习到数据集中的信息,而不仅仅是文本风格。

数据集特点

  • 数据集包含近似最优和高度次优的文本,用于测试Augmentoolkit的处理能力。
  • 数据集的创建旨在使数据成为微调的优势,而不是障碍。

数据集创建目的

  • 该数据集的创建是为了展示如何使用本地模型在个人计算机上基于任何可想象的文本来创建数据集。
  • 鼓励用户探索和使用该数据集进行模型微调,甚至可以创建和开源类似的数据集。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作