franlucc/py_all_renames_may3_seed-0-1_starcoderbase-1b
收藏Hugging Face2024-05-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/franlucc/py_all_renames_may3_seed-0-1_starcoderbase-1b
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: mutated_program
dtype: string
- name: mutations
sequence: string
- name: key
dtype: string
- name: prefix
dtype: string
- name: suffix
dtype: string
- name: middle
dtype: string
- name: correct
dtype: bool
- name: model
dtype: string
- name: fim_type
dtype: string
- name: fim_program
dtype: string
- name: hexsha
dtype: string
- name: mutated_generated_text
dtype: string
splits:
- name: train
num_bytes: 129838368
num_examples: 13754
download_size: 53294894
dataset_size: 129838368
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "py_all_renames_may3_seed-0-1_starcoderbase-1b"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征列表:
- 名称:变异程序(mutated_program),数据类型:字符串
- 名称:变异记录序列(mutations),数据类型:字符串序列
- 名称:键(key),数据类型:字符串
- 名称:前缀(prefix),数据类型:字符串
- 名称:后缀(suffix),数据类型:字符串
- 名称:中间段(middle),数据类型:字符串
- 名称:正确性标签(correct),数据类型:布尔值
- 名称:模型(model),数据类型:字符串
- 名称:中间填充任务类型(fim_type),数据类型:字符串
- 名称:中间填充生成程序(fim_program),数据类型:字符串
- 名称:Git提交哈希值(hexsha),数据类型:字符串
- 名称:变异生成文本(mutated_generated_text),数据类型:字符串
数据集划分:
- 划分名称:训练集(train),占用字节数:129838368,样本数量:13754
下载大小:53294894 字节
数据集总存储大小:129838368 字节
配置项:
- 配置名称:默认配置(default),数据文件:
- 数据集划分:训练集,文件路径:data/train-*
# “py_all_renames_may3_seed-0-1_starcoderbase-1b”数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
franlucc
原始信息汇总
数据集概述
数据集名称
- 名称: py_all_renames_may3_seed-0-1_starcoderbase-1b
数据集特征
- mutated_program: 字符串类型
- mutations: 字符串序列
- key: 字符串类型
- prefix: 字符串类型
- suffix: 字符串类型
- middle: 字符串类型
- correct: 布尔类型
- model: 字符串类型
- fim_type: 字符串类型
- fim_program: 字符串类型
- hexsha: 字符串类型
- mutated_generated_text: 字符串类型
数据集划分
- 训练集:
- 文件大小: 129838368 字节
- 示例数量: 13754
数据集大小
- 下载大小: 53294894 字节
- 数据集大小: 129838368 字节
配置信息
- 配置名称: default
- 数据文件:
- 划分: 训练集
- 路径: data/train-*



