mziem/predicts-1gpu
收藏Hugging Face2024-05-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mziem/predicts-1gpu
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: file_id
dtype: string
- name: content
dtype: string
- name: repo
dtype: string
- name: path
dtype: string
- name: token_length
dtype: int64
- name: original_comment
dtype: string
- name: comment_type
dtype: string
- name: detected_lang
dtype: string
- name: prompt
dtype: string
- name: masked_data
dtype: string
- name: predict
list:
- name: generated_text
dtype: string
splits:
- name: train
num_bytes: 16777102
num_examples: 959
download_size: 6440454
dataset_size: 16777102
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
This dataset includes various features such as file ID, content, repository, path, token length, original comment, comment type, detected language, prompt, masked data, and predicted generated text. The dataset is divided into a training set with 959 examples. The dataset size is 16777102 bytes, with a download size of 6440454 bytes.
提供机构:
mziem
原始信息汇总
数据集概述
数据集特征
- file_id: 数据类型为字符串。
- content: 数据类型为字符串。
- repo: 数据类型为字符串。
- path: 数据类型为字符串。
- token_length: 数据类型为整数。
- original_comment: 数据类型为字符串。
- comment_type: 数据类型为字符串。
- detected_lang: 数据类型为字符串。
- prompt: 数据类型为字符串。
- masked_data: 数据类型为字符串。
- predict: 包含一个子特征:
- generated_text: 数据类型为字符串。
数据集分割
- train: 包含959个示例,数据集大小为16777102字节。
数据集大小
- 下载大小: 6440454字节
- 数据集大小: 16777102字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



