five

DanCip/intellij-community-methods

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/DanCip/intellij-community-methods
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,如文件路径、方法名称、方法块、方法名称指针、方法签名和长度等。数据集被分为训练集、测试集和验证集,每个分割都有对应的字节大小和样本数量。数据集的下载大小为191329156字节,总大小为176156033字节。

The dataset includes multiple features such as file path, method name, method block, method name pointers, method signature, and length. The dataset is divided into training, test, and validation sets, each with corresponding byte sizes and sample counts. The download size of the dataset is 191329156 bytes, and the total size is 176156033 bytes.
提供机构:
DanCip
原始信息汇总

数据集概述

数据集特征

  • file_path: 文件路径,数据类型为字符串。
  • method_name: 方法名称,数据类型为字符串。
  • method_block: 方法块,数据类型为字符串。
  • method_name_pointers: 方法名称指针,数据类型为整数序列。
  • method_signature: 方法签名,数据类型为字符串。
  • length: 长度,数据类型为整数。
  • index_level_0: 索引级别0,数据类型为整数。

数据集分割

  • train: 训练集,包含181272个样本,总字节数为112580679。
  • test: 测试集,包含56648个样本,总字节数为35298274。
  • val: 验证集,包含45318个样本,总字节数为28277080。

数据集大小

  • 下载大小: 191329156字节。
  • 数据集大小: 176156033字节。

配置

  • default: 默认配置,包含以下数据文件路径:
    • train: data/train-*
    • test: data/test-*
    • val: data/val-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作