five

chathuranga-jayanath/context-5-finmath-times4j-html-mavendoxia-wro4j-guava-supercsv-len-10000-prompt-0

收藏
Hugging Face2024-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/chathuranga-jayanath/context-5-finmath-times4j-html-mavendoxia-wro4j-guava-supercsv-len-10000-prompt-0
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: int64 - name: filepath dtype: string - name: start_bug_line dtype: int64 - name: end_bug_line dtype: int64 - name: bug dtype: string - name: fix dtype: string - name: ctx dtype: string splits: - name: train num_bytes: 24095868 num_examples: 37517 - name: validation num_bytes: 3030934 num_examples: 4689 - name: test num_bytes: 3043669 num_examples: 4689 download_size: 12245462 dataset_size: 30170471 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* ---

数据集详情: 特征列: - 字段名:id,数据类型:int64 - 字段名:filepath,数据类型:string - 字段名:start_bug_line,数据类型:int64 - 字段名:end_bug_line,数据类型:int64 - 字段名:bug,数据类型:string - 字段名:fix,数据类型:string - 字段名:ctx(上下文),数据类型:string 数据集拆分: - 拆分名称:train(训练集),字节数:24095868,样本数量:37517 - 拆分名称:validation(验证集),字节数:3030934,样本数量:4689 - 拆分名称:test(测试集),字节数:3043669,样本数量:4689 下载大小:12245462 数据集总大小:30170471 配置项: - 配置名称:default,数据文件: - 拆分集:train,路径:data/train-* - 拆分集:validation,路径:data/validation-* - 拆分集:test,路径:data/test-*
提供机构:
chathuranga-jayanath
原始信息汇总

数据集概述

数据集特征

  • id: 数据项的唯一标识,数据类型为 int64
  • filepath: 文件路径,数据类型为 string
  • start_bug_line: 缺陷开始的行号,数据类型为 int64
  • end_bug_line: 缺陷结束的行号,数据类型为 int64
  • bug: 缺陷描述,数据类型为 string
  • fix: 修复描述,数据类型为 string
  • ctx: 上下文信息,数据类型为 string

数据集划分

  • train: 训练集,包含 37517 个样本,总字节数为 24095868。
  • validation: 验证集,包含 4689 个样本,总字节数为 3030934。
  • test: 测试集,包含 4689 个样本,总字节数为 3043669。

数据集大小

  • 下载大小: 12245462 字节。
  • 数据集大小: 30170471 字节。

配置信息

  • config_name: default
    • data_files:
      • train: 路径为 data/train-*
      • validation: 路径为 data/validation-*
      • test: 路径为 data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作