jcarbonnell/structTuningNEAR
收藏Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jcarbonnell/structTuningNEAR
下载链接
链接失效反馈官方服务:
资源简介:
structTuningNEAR数据集是nearData数据集的子集,专门用于预训练大语言模型(LLM)的结构感知微调。该数据集通过dApps树及其对应的README文件来指导模型,旨在让模型全面了解dApp的逻辑,从而在用户请求创建应用时,模型能够提供侧重于整体结构及其描述的输出。数据集包括3414个代表nearDapps文件树结构的文本文件和23166个从nearDapps文件中提取的README文本文件。
structTuningNEAR数据集是nearData数据集的子集,专门用于预训练大语言模型(LLM)的结构感知微调。该数据集通过dApps树及其对应的README文件来指导模型,旨在让模型全面了解dApp的逻辑,从而在用户请求创建应用时,模型能够提供侧重于整体结构及其描述的输出。数据集包括3414个代表nearDapps文件树结构的文本文件和23166个从nearDapps文件中提取的README文本文件。
提供机构:
jcarbonnell
原始信息汇总
structTuningNEAR 数据集概述
数据集组成
- nearDappsTrees: 包含3414个文本文件,代表从nearDapps文件中提取的树结构。
- nearDappsReadme: 包含23166个文本格式的readme文件,同样从nearDapps文件中提取。
数据集目的
该数据集专为预训练大型语言模型(LLM)的结构感知微调而设计。通过提供dApps树及其对应的readme文件,旨在增强模型对dApp整体逻辑的理解,以便在用户请求创建应用时,模型能主要提供关于应用大框架结构及其描述的输出。此微调方法旨在克服“下一令牌预测”逻辑的局限性,避免在处理复杂编程挑战时模型陷入无效循环。结构感知代码LLMs对于代码理解和代码讨论也具有重要价值。



