five

synthseq/flipflop

收藏
Hugging Face2023-10-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/synthseq/flipflop
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于Flip-Flop Language Modeling任务,旨在正确执行1位寄存器的顺序操作。尽管Transformer架构似乎适合此操作,但它会偶尔出现外推错误(称为注意力故障)。一个开放的挑战是如何在不依赖长尾数据或递归架构的情况下修复这些错误。数据集包含训练集、验证集、密集验证集和稀疏验证集,分别来自不同的FFL配置。
提供机构:
synthseq
原始信息汇总

数据集概述

数据集信息

  • 许可证:MIT
  • 配置
    • 默认配置
      • 训练集:路径为 data/train-*
      • 验证集:路径为 data/val-*
      • 密集验证集:路径为 data/val_dense-*
      • 稀疏验证集:路径为 data/val_sparse-*

数据集特征

  • 特征
    • 名称:text
    • 数据类型:string

数据集拆分

  • 训练集
    • 字节数:825600000
    • 样本数:1600000
  • 验证集
    • 字节数:8256000
    • 样本数:16000
  • 密集验证集
    • 字节数:2064000
    • 样本数:4000
  • 稀疏验证集
    • 字节数:82560000
    • 样本数:160000

数据集大小

  • 下载大小:354675733
  • 数据集大小:918480000
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作