rwkv-x-dev/lm-eval-data
收藏Hugging Face2024-08-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rwkv-x-dev/lm-eval-data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个大型的语言模型评估(lm-eval)结果集合,这些结果是使用特定的GitHub脚本为RWKV论文收集的,目的是为了进行分析。数据集包含训练和测试集的文件配置,但实际文件路径不存在。README文件还提供了如何克隆仓库的指令,包括不包含jsonl转储和包含存档文件的克隆方法。
This dataset represents a large collection of various lm-eval results built using specific GitHub scripts for the RWKV paper, aimed at analysis. It includes configurations for training and test set files, although the actual file paths do not exist. The README also provides instructions on how to clone the repository, both without the jsonl dump and with the archive files.
提供机构:
rwkv-x-dev
原始信息汇总
LM Eval 数据集
数据集概述
- 许可证:Apache 2.0
- 配置:
- 默认配置:
- 训练集:路径为 "DOES_NOT_EXIST_TRAIN.csv"
- 测试集:路径为 "DOES_NOT_EXIST_TEST.csv"
- 默认配置:
数据集目标
- 收集大量语言模型评估(LM-eval)结果,用于分析和相关论文。
数据集操作
-
克隆仓库(不包含jsonl文件): shell export GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/datasets/rwkv-x-dev/lm-eval-data.git
-
克隆仓库(包含大型归档文件): shell
克隆包含归档文件
git lfs clone https://huggingface.co/datasets/rwkv-x-dev/lm-eval-data.git
解压缩所有归档文件
./scripts/decompress-all-jsonl.sh



