jenyag/repo-codegen-py-non-py-context-path-distance
收藏Hugging Face2024-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jenyag/repo-codegen-py-non-py-context-path-distance
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: repo_id
dtype: int64
- name: repo_name
dtype: string
- name: project_context
dtype: string
- name: file_context
list:
- name: content
dtype: string
- name: type
dtype: string
- name: gt
sequence: string
- name: metainfo_separator
dtype: string
splits:
- name: test
num_bytes: 560157388
num_examples: 224
download_size: 226460548
dataset_size: 560157388
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
# Dataset Card for "repo-codegen-py-non-py-context-path-distance"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
jenyag
原始信息汇总
数据集概述
数据集信息
-
特征列表:
repo_id: 数据类型为int64repo_name: 数据类型为stringproject_context: 数据类型为stringfile_context: 包含以下子特征:content: 数据类型为stringtype: 数据类型为string
gt: 数据类型为sequence的stringmetainfo_separator: 数据类型为string
-
数据分割:
test: 包含 224 个样本,总字节数为 560157388 字节
-
数据集大小:
- 下载大小: 226460548 字节
- 数据集大小: 560157388 字节
配置信息
- 配置名称:
default- 数据文件:
test分割的数据文件路径:data/test-*
- 数据文件:



