codeparrot/github-jupyter-code-to-text
收藏Hugging Face2023-11-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/codeparrot/github-jupyter-code-to-text
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由Python代码序列和解释其功能的文档字符串组成。它是通过连接来自另一个数据集的代码和文本对构建的,这些代码和文本对最初是Jupyter Notebook中的代码和Markdown单元格。每个示例的内容包括代码和解释文本,格式如下:[CODE] """Explanation: [TEXT] End of explanation """ [CODE] """Explanation: [TEXT] End of explanation """ ...
提供机构:
codeparrot
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本生成
- 标签: 代码
- 大小类别: 10K<n<100K
- 语言: 英语
数据集内容
-
数据集包含Python代码序列及其功能解释的docstring。
-
数据来源于原始的代码和Markdown单元格,这些单元格来自Jupyter Notebooks。
-
每个示例的结构如下:
[CODE] """ Explanation: [TEXT] End of explanation """ [CODE] """ Explanation: [TEXT] End of explanation """ ...
数据集结构
- 特征: repo_name, path, license, content
- 行数: 47452



