five

NamCyan/RepoCodeGen-v2

收藏
Hugging Face2024-04-01 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/NamCyan/RepoCodeGen-v2
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: int64 - name: project dtype: string - name: module dtype: string - name: entry_point dtype: string - name: solution dtype: string - name: prompt dtype: string - name: target_function_prompt dtype: string - name: function_signature dtype: string - name: test dtype: string - name: test_list sequence: string - name: docstring dtype: string - name: original_docstring dtype: string - name: docstring_tokens sequence: string - name: cross_context dtype: bool - name: isContained dtype: bool - name: line_coverage dtype: float32 - name: raw_solution dtype: string - name: check dtype: string splits: - name: medium_context num_bytes: 25747789 num_examples: 355 - name: short_context num_bytes: 25624501 num_examples: 355 - name: full_context num_bytes: 25959446 num_examples: 355 download_size: 15558351 dataset_size: 77331736 --- # Dataset Card for "RepoCodeGen-v2" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
NamCyan
原始信息汇总

数据集概述

数据集信息

  • 数据集名称: RepoCodeGen-v2
  • 下载大小: 15558351 字节
  • 数据集大小: 77331736 字节

特征信息

  • id: 数据类型为 int64
  • project: 数据类型为 string
  • module: 数据类型为 string
  • entry_point: 数据类型为 string
  • solution: 数据类型为 string
  • prompt: 数据类型为 string
  • target_function_prompt: 数据类型为 string
  • function_signature: 数据类型为 string
  • test: 数据类型为 string
  • test_list: 数据类型为 sequence of string
  • docstring: 数据类型为 string
  • original_docstring: 数据类型为 string
  • docstring_tokens: 数据类型为 sequence of string
  • cross_context: 数据类型为 bool
  • isContained: 数据类型为 bool
  • line_coverage: 数据类型为 float32
  • raw_solution: 数据类型为 string
  • check: 数据类型为 string

数据集分割

  • medium_context:
    • 字节数: 25747789
    • 样本数: 355
  • short_context:
    • 字节数: 25624501
    • 样本数: 355
  • full_context:
    • 字节数: 25959446
    • 样本数: 355
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作