awentzonline/babylm2024
收藏Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/awentzonline/babylm2024
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: 100M
data_files:
- split: train
path: "train/100M/*"
- split: validation
path: "dev/*"
- split: test
path: "test/*"
- config_name: 10M
data_files:
- split: train
path: "train/10M/*"
- split: validation
path: "dev/*"
- split: test
path: "test/*"
---
# Dataset Card for "babylm2024"
配置项:
- 配置名称:100M
数据文件列表:
- 数据集划分:训练集(train),文件路径:"train/100M/*"
- 数据集划分:验证集(validation),文件路径:"dev/*"
- 数据集划分:测试集(test),文件路径:"test/*"
- 配置名称:10M
数据文件列表:
- 数据集划分:训练集(train),文件路径:"train/10M/*"
- 数据集划分:验证集(validation),文件路径:"dev/*"
- 数据集划分:测试集(test),文件路径:"test/*"
# 「babylm2024」数据集卡片
提供机构:
awentzonline
原始信息汇总
数据集概述
配置详情
配置1: 100M
- 训练数据:
train/100M/* - 验证数据:
dev/* - 测试数据:
test/*
配置2: 10M
- 训练数据:
train/10M/* - 验证数据:
dev/* - 测试数据:
test/*



