hle2000/Mintaka_Graph_Features_T5-xl-ssm
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hle2000/Mintaka_Graph_Features_T5-xl-ssm
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: question_answer
dtype: string
- name: num_nodes
dtype: int64
- name: num_edges
dtype: int64
- name: density
dtype: float64
- name: cycle
dtype: int64
- name: bridge
dtype: int64
- name: katz_centrality
dtype: float64
- name: page_rank
dtype: float64
- name: avg_ssp_length
dtype: float64
- name: graph_sequence
dtype: string
- name: updated_graph_sequence
dtype: string
- name: graph_sequence_embedding
dtype: string
- name: updated_graph_sequence_embedding
dtype: string
- name: question_answer_embedding
dtype: string
- name: tfidf_vector
dtype: string
- name: correct
dtype: float64
splits:
- name: train
num_bytes: 8930682861
num_examples: 86381
- name: test
num_bytes: 2234104926
num_examples: 21574
download_size: 2056059858
dataset_size: 11164787787
---
# Dataset Card for "Mintaka_Graph_Features_T5-xl-ssm"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
hle2000
原始信息汇总
数据集概述
特征信息
数据集包含以下特征:
- question: 类型为字符串。
- question_answer: 类型为字符串。
- num_nodes: 类型为整数(int64)。
- num_edges: 类型为整数(int64)。
- density: 类型为浮点数(float64)。
- cycle: 类型为整数(int64)。
- bridge: 类型为整数(int64)。
- katz_centrality: 类型为浮点数(float64)。
- page_rank: 类型为浮点数(float64)。
- avg_ssp_length: 类型为浮点数(float64)。
- graph_sequence: 类型为字符串。
- updated_graph_sequence: 类型为字符串。
- graph_sequence_embedding: 类型为字符串。
- updated_graph_sequence_embedding: 类型为字符串。
- question_answer_embedding: 类型为字符串。
- tfidf_vector: 类型为字符串。
- correct: 类型为浮点数(float64)。
数据分割
数据集分为以下部分:
- train: 包含86381个样本,大小为8930682861字节。
- test: 包含21574个样本,大小为2234104926字节。
数据集大小
- 下载大小: 2056059858字节。
- 数据集总大小: 11164787787字节。



