five

codeparrot/github-jupyter-code-to-text

收藏
Hugging Face2023-11-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/codeparrot/github-jupyter-code-to-text
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由Python代码序列和解释其功能的文档字符串组成。它是通过连接来自另一个数据集的代码和文本对构建的,这些代码和文本对最初是Jupyter Notebook中的代码和Markdown单元格。每个示例的内容包括代码和解释文本,格式如下:[CODE] """Explanation: [TEXT] End of explanation """ [CODE] """Explanation: [TEXT] End of explanation """ ...
提供机构:
codeparrot
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本生成
  • 标签: 代码
  • 大小类别: 10K<n<100K
  • 语言: 英语

数据集内容

  • 数据集包含Python代码序列及其功能解释的docstring。

  • 数据来源于原始的代码和Markdown单元格,这些单元格来自Jupyter Notebooks。

  • 每个示例的结构如下:

    [CODE] """ Explanation: [TEXT] End of explanation """ [CODE] """ Explanation: [TEXT] End of explanation """ ...

数据集结构

  • 特征: repo_name, path, license, content
  • 行数: 47452
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作