five

rwkv-x-dev/lm-eval-data

收藏
Hugging Face2024-08-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rwkv-x-dev/lm-eval-data
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个大型的语言模型评估(lm-eval)结果集合,这些结果是使用特定的GitHub脚本为RWKV论文收集的,目的是为了进行分析。数据集包含训练和测试集的文件配置,但实际文件路径不存在。README文件还提供了如何克隆仓库的指令,包括不包含jsonl转储和包含存档文件的克隆方法。

This dataset represents a large collection of various lm-eval results built using specific GitHub scripts for the RWKV paper, aimed at analysis. It includes configurations for training and test set files, although the actual file paths do not exist. The README also provides instructions on how to clone the repository, both without the jsonl dump and with the archive files.
提供机构:
rwkv-x-dev
原始信息汇总

LM Eval 数据集

数据集概述

  • 许可证:Apache 2.0
  • 配置
    • 默认配置
      • 训练集:路径为 "DOES_NOT_EXIST_TRAIN.csv"
      • 测试集:路径为 "DOES_NOT_EXIST_TEST.csv"

数据集目标

  • 收集大量语言模型评估(LM-eval)结果,用于分析和相关论文。

数据集操作

  • 克隆仓库(不包含jsonl文件): shell export GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/datasets/rwkv-x-dev/lm-eval-data.git

  • 克隆仓库(包含大型归档文件): shell

    克隆包含归档文件

    git lfs clone https://huggingface.co/datasets/rwkv-x-dev/lm-eval-data.git

    解压缩所有归档文件

    ./scripts/decompress-all-jsonl.sh

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作