MorishT/2024-07-08.JFLD.cmpl-0.2.dstrct-5.step-3
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/MorishT/2024-07-08.JFLD.cmpl-0.2.dstrct-5.step-3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要包含假设、事实、证明及其公式化表示,以及相关的负面假设和证明。数据集还记录了树结构的深度和步骤信息,以及各种干扰项的数量。数据集分为训练集和测试集,每个集合包含3000个样本。
This dataset primarily includes hypotheses, facts, proofs, and their formulaic representations, along with related negative hypotheses and proofs. The dataset also records the depth and steps of tree structures, as well as the number of various distractors. The dataset is divided into training and test sets, each containing 3000 samples.
提供机构:
MorishT
原始信息汇总
数据集概述
特征信息
- version: 字符串类型
- hypothesis: 字符串类型
- hypothesis_formula: 字符串类型
- facts: 字符串类型
- facts_formula: 字符串类型
- proofs: 字符串序列类型
- proofs_formula: 字符串序列类型
- negative_hypothesis: 字符串类型
- negative_hypothesis_formula: 字符串类型
- negative_proofs: 字符串序列类型
- negative_original_tree_depth: 64位整数类型
- original_tree_steps: 64位整数类型
- original_tree_depth: 64位整数类型
- steps: 64位整数类型
- depth: 64位整数类型
- num_formula_distractors: 64位整数类型
- num_translation_distractors: 64位整数类型
- num_all_distractors: 64位整数类型
- proof_label: 字符串类型
- negative_proof_label: 字符串类型
- world_assump_label: 字符串类型
- negative_world_assump_label: 字符串类型
- prompt_serial: 字符串类型
- proof_serial: 字符串类型
- prompt_serial_formula: 字符串类型
- proof_serial_formula: 字符串类型
数据集划分
- train:
- 字节数: 6653467
- 样本数: 3000
- test:
- 字节数: 6664948
- 样本数: 3000
数据集大小
- 下载大小: 4402680 字节
- 数据集总大小: 13318415 字节
配置信息
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
- data_files:



