nuprl-staging/training_classifier_v1
收藏Hugging Face2024-11-18 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/nuprl-staging/training_classifier_v1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: prompt
dtype: string
- name: answer
dtype: string
- name: num_nodes
dtype: int64
- name: num_edges
dtype: int64
- name: avg_node_edge
dtype: float64
- name: graph_density
dtype: float64
- name: num_classes
dtype: int64
- name: avg_node_class
dtype: float64
- name: max_num_field
dtype: int64
- name: min_num_field
dtype: int64
- name: avg_num_field
dtype: float64
- name: path_length
dtype: int64
- name: max_node_visits
dtype: int64
- name: max_edge_visits
dtype: int64
- name: unique_node_number
dtype: int64
- name: path_node_coverage
dtype: float64
- name: unique_edge_number
dtype: int64
- name: path_edge_coverage
dtype: float64
- name: num_cycle
dtype: int64
- name: shortest_cycle
dtype: float64
- name: longest_cycle
dtype: float64
- name: average_cycle
dtype: float64
- name: unique_edge_label
dtype: int64
- name: max_label_occurrences
dtype: int64
- name: max_label_consecutive
dtype: int64
- name: max_node_outdegree
dtype: int64
- name: correctness
dtype: bool
- name: one_correct
dtype: bool
splits:
- name: train
num_bytes: 2489928
num_examples: 3000
- name: test
num_bytes: 414386
num_examples: 500
download_size: 613345
dataset_size: 2904314
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 名称:样本ID,数据类型:64位整数(int64)
- 名称:提示词(prompt),数据类型:字符串(string)
- 名称:回答(answer),数据类型:字符串(string)
- 名称:节点数(num_nodes),数据类型:64位整数(int64)
- 名称:边数(num_edges),数据类型:64位整数(int64)
- 名称:平均节点边数(avg_node_edge),数据类型:64位浮点数(float64)
- 名称:图密度(graph_density),数据类型:64位浮点数(float64)
- 名称:类别数(num_classes),数据类型:64位整数(int64)
- 名称:平均节点类别数(avg_node_class),数据类型:64位浮点数(float64)
- 名称:最大字段数(max_num_field),数据类型:64位整数(int64)
- 名称:最小字段数(min_num_field),数据类型:64位整数(int64)
- 名称:平均字段数(avg_num_field),数据类型:64位浮点数(float64)
- 名称:路径长度(path_length),数据类型:64位整数(int64)
- 名称:最大节点访问数(max_node_visits),数据类型:64位整数(int64)
- 名称:最大边访问数(max_edge_visits),数据类型:64位整数(int64)
- 名称:唯一节点数(unique_node_number),数据类型:64位整数(int64)
- 名称:路径节点覆盖率(path_node_coverage),数据类型:64位浮点数(float64)
- 名称:唯一边数(unique_edge_number),数据类型:64位整数(int64)
- 名称:路径边覆盖率(path_edge_coverage),数据类型:64位浮点数(float64)
- 名称:环数量(num_cycle),数据类型:64位整数(int64)
- 名称:最短环长度(shortest_cycle),数据类型:64位浮点数(float64)
- 名称:最长环长度(longest_cycle),数据类型:64位浮点数(float64)
- 名称:平均环长度(average_cycle),数据类型:64位浮点数(float64)
- 名称:唯一边标签数(unique_edge_label),数据类型:64位整数(int64)
- 名称:标签最大出现次数(max_label_occurrences),数据类型:64位整数(int64)
- 名称:标签最大连续出现次数(max_label_consecutive),数据类型:64位整数(int64)
- 名称:节点最大出度(max_node_outdegree),数据类型:64位整数(int64)
- 名称:正确性标记(correctness),数据类型:布尔型(bool)
- 名称:单条正确性标记(one_correct),数据类型:布尔型(bool)
数据划分:
- 划分名称:训练集(train),占用字节数:2489928,样本数量:3000
- 划分名称:测试集(test),占用字节数:414386,样本数量:500
下载总大小:613345,数据集总大小:2904314
数据集配置:
- 配置名称:默认配置(default),数据文件路径:
- 训练集:data/train-*
- 测试集:data/test-*
提供机构:
nuprl-staging



