taesiri/simple_fsm_bench2

Name: taesiri/simple_fsm_bench2
Creator: taesiri
Published: 2024-02-08 03:41:04
License: 暂无描述

Hugging Face2024-02-08 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/taesiri/simple_fsm_bench2

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: id dtype: string - name: fsm_json dtype: string - name: string dtype: string - name: label dtype: string - name: difficulty_level dtype: int64 - name: num_states dtype: int64 - name: num_transitions dtype: int64 - name: dot dtype: string - name: transition_matrix dtype: string - name: start_state dtype: string - name: accepting_states sequence: string splits: - name: train num_bytes: 97257596 num_examples: 21452 - name: validation num_bytes: 49657155 num_examples: 11102 download_size: 1795783 dataset_size: 146914751 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* ---

提供机构：

taesiri

原始信息汇总

数据集概述

数据特征

id: 数据类型为字符串。
fsm_json: 数据类型为字符串。
string: 数据类型为字符串。
label: 数据类型为字符串。
difficulty_level: 数据类型为整数（int64）。
num_states: 数据类型为整数（int64）。
num_transitions: 数据类型为整数（int64）。
dot: 数据类型为字符串。
transition_matrix: 数据类型为字符串。
start_state: 数据类型为字符串。
accepting_states: 数据类型为字符串序列。

数据分割

train: 包含21452个样本，总字节数为97257596。
validation: 包含11102个样本，总字节数为49657155。

数据集大小

下载大小: 1795783字节。
数据集大小: 146914751字节。

配置

default:
- train: 数据文件路径为data/train-*。
- validation: 数据文件路径为data/validation-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集