hle2000/Mintaka_Graph_Features_Updated_T5-large-ssm
收藏Hugging Face2024-03-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/hle2000/Mintaka_Graph_Features_Updated_T5-large-ssm
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: question_answer
dtype: string
- name: num_nodes
dtype: int64
- name: num_edges
dtype: int64
- name: density
dtype: float64
- name: cycle
dtype: int64
- name: bridge
dtype: int64
- name: katz_centrality
dtype: float64
- name: page_rank
dtype: float64
- name: avg_ssp_length
dtype: float64
- name: determ_sequence
dtype: string
- name: gap_sequence
dtype: string
- name: g2t_sequence
dtype: string
- name: determ_sequence_embedding
dtype: string
- name: gap_sequence_embedding
dtype: string
- name: g2t_sequence_embedding
dtype: string
- name: question_answer_embedding
dtype: string
- name: tfidf_vector
dtype: string
- name: correct
dtype: float64
splits:
- name: train
num_bytes: 10203485753
num_examples: 90261
- name: test
num_bytes: 2579614925
num_examples: 22772
download_size: 2782389958
dataset_size: 12783100678
---
# Dataset Card for "Mintaka_Graph_Features_Updated_T5-large-ssm"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hle2000
原始信息汇总
数据集概述
数据集名称
Mintaka_Graph_Features_Updated_T5-large-ssm
数据集特征
- 问题 (question): 数据类型为字符串。
- 问题答案 (question_answer): 数据类型为字符串。
- 节点数 (num_nodes): 数据类型为整数64位。
- 边数 (num_edges): 数据类型为整数64位。
- 密度 (density): 数据类型为浮点数64位。
- 环 (cycle): 数据类型为整数64位。
- 桥 (bridge): 数据类型为整数64位。
- Katz中心性 (katz_centrality): 数据类型为浮点数64位。
- PageRank (page_rank): 数据类型为浮点数64位。
- 平均最短路径长度 (avg_ssp_length): 数据类型为浮点数64位。
- 确定性序列 (determ_sequence): 数据类型为字符串。
- 间隙序列 (gap_sequence): 数据类型为字符串。
- G2T序列 (g2t_sequence): 数据类型为字符串。
- 确定性序列嵌入 (determ_sequence_embedding): 数据类型为字符串。
- 间隙序列嵌入 (gap_sequence_embedding): 数据类型为字符串。
- G2T序列嵌入 (g2t_sequence_embedding): 数据类型为字符串。
- 问题答案嵌入 (question_answer_embedding): 数据类型为字符串。
- TF-IDF向量 (tfidf_vector): 数据类型为字符串。
- 正确性 (correct): 数据类型为浮点数64位。
数据集分割
- 训练集 (train): 大小为10203485753字节,包含90261个样本。
- 测试集 (test): 大小为2579614925字节,包含22772个样本。
数据集大小
- 下载大小: 2782389958字节。
- 数据集总大小: 12783100678字节。



