CM/codexglue_code2text_java
收藏Hugging Face2023-04-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CM/codexglue_code2text_java
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int32
- name: repo
dtype: string
- name: path
dtype: string
- name: func_name
dtype: string
- name: original_string
dtype: string
- name: language
dtype: string
- name: code
dtype: string
- name: code_tokens
sequence: string
- name: docstring
dtype: string
- name: docstring_tokens
sequence: string
- name: sha
dtype: string
- name: url
dtype: string
splits:
- name: train
num_bytes: 452553835
num_examples: 164923
- name: validation
num_bytes: 13366344
num_examples: 5183
- name: test
num_bytes: 29080753
num_examples: 10955
download_size: 154860056
dataset_size: 495000932
---
# Dataset Card for "codexglue_code2text_java"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征:
- 名称:id,数据类型:int32
- 名称:repo,数据类型:字符串
- 名称:path,数据类型:字符串
- 名称:func_name,数据类型:字符串
- 名称:original_string,数据类型:字符串
- 名称:language,数据类型:字符串
- 名称:code,数据类型:字符串
- 名称:code_tokens,数据类型:字符串序列
- 名称:文档字符串(docstring),数据类型:字符串
- 名称:docstring_tokens,数据类型:字符串序列
- 名称:sha,数据类型:字符串
- 名称:url,数据类型:字符串
数据集划分:
- 划分名称:训练集(train),字节数:452553835,样本数量:164923
- 划分名称:验证集(validation),字节数:13366344,样本数量:5183
- 划分名称:测试集(test),字节数:29080753,样本数量:10955
下载大小:154860056字节
数据集总大小:495000932字节
# "codexglue_code2text_java"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
CM
原始信息汇总
数据集概述
数据集名称
- 名称: codexglue_code2text_java
数据结构
- 特征:
- id: int32
- repo: string
- path: string
- func_name: string
- original_string: string
- language: string
- code: string
- code_tokens: sequence of string
- docstring: string
- docstring_tokens: sequence of string
- sha: string
- url: string
数据分割
- 训练集:
- 字节数: 452553835
- 示例数: 164923
- 验证集:
- 字节数: 13366344
- 示例数: 5183
- 测试集:
- 字节数: 29080753
- 示例数: 10955
数据集大小
- 下载大小: 154860056
- 数据集总大小: 495000932



