synthseq/flipflop
收藏Hugging Face2023-10-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/synthseq/flipflop
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于Flip-Flop Language Modeling任务,旨在正确执行1位寄存器的顺序操作。尽管Transformer架构似乎适合此操作,但它会偶尔出现外推错误(称为注意力故障)。一个开放的挑战是如何在不依赖长尾数据或递归架构的情况下修复这些错误。数据集包含训练集、验证集、密集验证集和稀疏验证集,分别来自不同的FFL配置。
提供机构:
synthseq
原始信息汇总
数据集概述
数据集信息
- 许可证:MIT
- 配置:
- 默认配置:
- 训练集:路径为
data/train-* - 验证集:路径为
data/val-* - 密集验证集:路径为
data/val_dense-* - 稀疏验证集:路径为
data/val_sparse-*
- 训练集:路径为
- 默认配置:
数据集特征
- 特征:
- 名称:text
- 数据类型:string
数据集拆分
- 训练集:
- 字节数:825600000
- 样本数:1600000
- 验证集:
- 字节数:8256000
- 样本数:16000
- 密集验证集:
- 字节数:2064000
- 样本数:4000
- 稀疏验证集:
- 字节数:82560000
- 样本数:160000
数据集大小
- 下载大小:354675733
- 数据集大小:918480000



