loubnabnl/dockerfile_checks
收藏Hugging Face2023-03-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/loubnabnl/dockerfile_checks
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: entities
list:
- name: context
dtype: string
- name: end
dtype: int64
- name: score
dtype: float32
- name: start
dtype: int64
- name: tag
dtype: string
- name: value
dtype: string
- name: max_stars_repo_path
dtype: string
- name: max_stars_repo_name
dtype: string
- name: max_stars_count
dtype: int64
- name: content
dtype: string
- name: id
dtype: string
- name: new_content
dtype: string
- name: modified
dtype: bool
- name: references
dtype: string
splits:
- name: train
num_bytes: 304825212.1287143
num_examples: 137651
download_size: 265293128
dataset_size: 304825212.1287143
---
# Dataset Card for "dockerfile_checks"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 字段名:entities(实体),类型:列表,列表内每个元素包含以下子字段:
- 子字段名:context(上下文),数据类型:string(字符串型)
- 子字段名:end,数据类型:int64(64位整数)
- 子字段名:score,数据类型:float32(32位单精度浮点数)
- 子字段名:start,数据类型:int64(64位整数)
- 子字段名:tag(标签),数据类型:string(字符串型)
- 子字段名:value(取值),数据类型:string(字符串型)
- 字段名:max_stars_repo_path(最高星仓库路径),数据类型:string(字符串型)
- 字段名:max_stars_repo_name(最高星仓库名称),数据类型:string(字符串型)
- 字段名:max_stars_count(最高星星标数),数据类型:int64(64位整数)
- 字段名:content(内容),数据类型:string(字符串型)
- 字段名:id(标识符),数据类型:string(字符串型)
- 字段名:new_content(新内容),数据类型:string(字符串型)
- 字段名:modified(已修改标记),数据类型:bool(布尔型)
- 字段名:references(参考来源),数据类型:string(字符串型)
数据拆分:
- 拆分名称:train(训练集),字节数:304825212.1287143,样本数量:137651
下载大小:265293128
数据集总大小:304825212.1287143
---
# 「dockerfile_checks」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
loubnabnl
原始信息汇总
数据集概述
数据集特征
- entities
- context: 数据类型为
string - end: 数据类型为
int64 - score: 数据类型为
float32 - start: 数据类型为
int64 - tag: 数据类型为
string - value: 数据类型为
string
- context: 数据类型为
- max_stars_repo_path: 数据类型为
string - max_stars_repo_name: 数据类型为
string - max_stars_count: 数据类型为
int64 - content: 数据类型为
string - id: 数据类型为
string - new_content: 数据类型为
string - modified: 数据类型为
bool - references: 数据类型为
string
数据集划分
- train
- num_bytes: 304825212.1287143
- num_examples: 137651
数据集大小
- download_size: 265293128
- dataset_size: 304825212.1287143



