five

notebookcdg

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/notebookcdg
下载链接
链接失效反馈
官方服务:
资源简介:
受王等人的启发。 2021 年,我们决定利用投票率最高且记录良好的 Kaggle 笔记本来构建 notebookCDG 数据集。我们从 Kaggle 上的前 20 名热门比赛(例如泰坦尼克号)中收集了前 10% 的高投票笔记本。我们检查了 20 场比赛中每场比赛的数据政策,都没有版权问题。我们还联系了 Kaggle 管理员,以确保我们的数据收集符合平台政策。我们总共收集了 3,944 个笔记本作为原始数据。数据预处理后,最终数据集包含来自原始数据的 3,944 个笔记本中的 2,476 个笔记本。它有 28,625 个代码-文档对。整体代码降价比为 2.2195
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
notebookcdg数据集基于Kaggle热门比赛的高投票笔记本构建,包含2,476个笔记本和28,625个代码-文档对,专门用于代码摘要生成任务。该数据集由密歇根大学等机构于2021年发布,遵循MIT许可协议。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作