five

jcarbonnell/structTuningNEAR

收藏
Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/jcarbonnell/structTuningNEAR
下载链接
链接失效反馈
官方服务:
资源简介:
structTuningNEAR数据集是nearData数据集的子集,专门用于预训练大语言模型(LLM)的结构感知微调。该数据集通过dApps树及其对应的README文件来指导模型,旨在让模型全面了解dApp的逻辑,从而在用户请求创建应用时,模型能够提供侧重于整体结构及其描述的输出。数据集包括3414个代表nearDapps文件树结构的文本文件和23166个从nearDapps文件中提取的README文本文件。

structTuningNEAR数据集是nearData数据集的子集,专门用于预训练大语言模型(LLM)的结构感知微调。该数据集通过dApps树及其对应的README文件来指导模型,旨在让模型全面了解dApp的逻辑,从而在用户请求创建应用时,模型能够提供侧重于整体结构及其描述的输出。数据集包括3414个代表nearDapps文件树结构的文本文件和23166个从nearDapps文件中提取的README文本文件。
提供机构:
jcarbonnell
原始信息汇总

structTuningNEAR 数据集概述

数据集组成

  • nearDappsTrees: 包含3414个文本文件,代表从nearDapps文件中提取的树结构。
  • nearDappsReadme: 包含23166个文本格式的readme文件,同样从nearDapps文件中提取。

数据集目的

该数据集专为预训练大型语言模型(LLM)的结构感知微调而设计。通过提供dApps树及其对应的readme文件,旨在增强模型对dApp整体逻辑的理解,以便在用户请求创建应用时,模型能主要提供关于应用大框架结构及其描述的输出。此微调方法旨在克服“下一令牌预测”逻辑的局限性,避免在处理复杂编程挑战时模型陷入无效循环。结构感知代码LLMs对于代码理解和代码讨论也具有重要价值。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作