five

fblgit/tree-of-knowledge

收藏
Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fblgit/tree-of-knowledge
下载链接
链接失效反馈
官方服务:
资源简介:
ToK(知识树)是一个新颖的数据集,旨在通过简单的输入和输出提示激发知识符号关联。该数据集可用于多种目的,包括从模型中提取知识、用新数据微调模型、创建细粒度领域知识集以及提高训练性能。数据集引入了多种特性,如缩写标记、提示关键词、方向关键词、方法关键词、高效聚合关键词和分离关系关键词。
提供机构:
fblgit
原始信息汇总

数据集名称

tree-of-knowledge-llm

数据集描述

ToK,即知识树,是为大型语言模型(LLM)设计的一种创新数据集,旨在通过简单的输入和输出提示激发知识的符号相关性。

数据集用途

  • 从模型中提取知识
  • 使用新数据微调模型
  • 创建细粒度领域知识集
  • 提高训练性能

数据集特点

  • 引入缩写掩码,如...
  • 引入提示关键词,如[ADVANTAGES], [CHARACTERISTICS], [RULES]
  • 引入方向关键词,如AS, AND, IN, BETWEEN, RANGING
  • 引入方法关键词,如NOTATED, PREDICTING, CALCULATED
  • 引入高效聚合关键词===
  • 引入分离关系关键词&&

数据集版本更新

  • 2023-05-20:发布第一版数据集,包含示例。
  • 2023-05-21:在data/文件夹下添加了首批3000个数据集项。

数据集示例

json { "instruction": "Describe energy", "input": "", "output": "Energy AS ability TO do work OR cause change WITHIN system && forms of energy==[kinetic, potential, thermal, chemical, ... [TYPES]] && conservation of energy==law STATING energy CANNOT be created OR destroyed ONLY transformed BETWEEN forms && energy sources==[fossil fuels, nuclear, solar, wind, ... [EXAMPLES]] USED TO power human activities" }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作