five

CoNaLa Dataset

收藏
知名数据集2026-04-23 收录
下载链接:
https://conala-corpus.github.io/
下载链接
链接失效反馈
官方服务:
资源简介:
CoNaLa是由卡内基梅隆大学NeuLab和STRUDEL实验室联合开发的代码与自然语言对齐数据集。该数据集包含从Stack Overflow爬取并经过人工标注的Python代码片段与自然语言意图配对,旨在评估代码生成任务的性能。数据集分为2,379个训练样本和500个测试样本,另提供约60万个自动挖掘的示例,可用于训练从自然语言查询生成代码片段的系统。
提供机构:
卡内基梅隆大学NeuLab; 卡内基梅隆大学STRUDEL实验室
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作