fblgit/tree-of-knowledge
收藏Hugging Face2023-05-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fblgit/tree-of-knowledge
下载链接
链接失效反馈官方服务:
资源简介:
ToK(知识树)是一个新颖的数据集,旨在通过简单的输入和输出提示激发知识符号关联。该数据集可用于多种目的,包括从模型中提取知识、用新数据微调模型、创建细粒度领域知识集以及提高训练性能。数据集引入了多种特性,如缩写标记、提示关键词、方向关键词、方法关键词、高效聚合关键词和分离关系关键词。
提供机构:
fblgit
原始信息汇总
数据集名称
tree-of-knowledge-llm
数据集描述
ToK,即知识树,是为大型语言模型(LLM)设计的一种创新数据集,旨在通过简单的输入和输出提示激发知识的符号相关性。
数据集用途
- 从模型中提取知识
- 使用新数据微调模型
- 创建细粒度领域知识集
- 提高训练性能
数据集特点
- 引入缩写掩码,如
... - 引入提示关键词,如
[ADVANTAGES],[CHARACTERISTICS],[RULES] - 引入方向关键词,如
AS,AND,IN,BETWEEN,RANGING - 引入方法关键词,如
NOTATED,PREDICTING,CALCULATED - 引入高效聚合关键词
=== - 引入分离关系关键词
&&
数据集版本更新
- 2023-05-20:发布第一版数据集,包含示例。
- 2023-05-21:在
data/文件夹下添加了首批3000个数据集项。
数据集示例
json { "instruction": "Describe energy", "input": "", "output": "Energy AS ability TO do work OR cause change WITHIN system && forms of energy==[kinetic, potential, thermal, chemical, ... [TYPES]] && conservation of energy==law STATING energy CANNOT be created OR destroyed ONLY transformed BETWEEN forms && energy sources==[fossil fuels, nuclear, solar, wind, ... [EXAMPLES]] USED TO power human activities" }



