five

codefuse-ai/GALLa

收藏
Hugging Face2025-02-27 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/codefuse-ai/GALLa
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了用于研究论文《GALLa: 图对齐的大型语言模型以改善源代码理解》的Python和Java抽象语法树(AST)以及数据流图(DFG)数据。数据集还包括节点类型嵌入文件和生成第二阶段指令数据的代码。

This dataset contains Python and Java AST (Abstract Syntax Tree) and DFG (Data Flow Graph) data used in the research paper GALLa: Graph Aligned Large Language Models for Improved Source Code Understanding. It also includes node type embedding files and code for generating stage 2 instruction data.
提供机构:
codefuse-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作