five

awentzonline/babylm2024

收藏
Hugging Face2024-05-23 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/awentzonline/babylm2024
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: 100M data_files: - split: train path: "train/100M/*" - split: validation path: "dev/*" - split: test path: "test/*" - config_name: 10M data_files: - split: train path: "train/10M/*" - split: validation path: "dev/*" - split: test path: "test/*" --- # Dataset Card for "babylm2024"

配置项: - 配置名称:100M 数据文件列表: - 数据集划分:训练集(train),文件路径:"train/100M/*" - 数据集划分:验证集(validation),文件路径:"dev/*" - 数据集划分:测试集(test),文件路径:"test/*" - 配置名称:10M 数据文件列表: - 数据集划分:训练集(train),文件路径:"train/10M/*" - 数据集划分:验证集(validation),文件路径:"dev/*" - 数据集划分:测试集(test),文件路径:"test/*" # 「babylm2024」数据集卡片
提供机构:
awentzonline
原始信息汇总

数据集概述

配置详情

配置1: 100M

  • 训练数据: train/100M/*
  • 验证数据: dev/*
  • 测试数据: test/*

配置2: 10M

  • 训练数据: train/10M/*
  • 验证数据: dev/*
  • 测试数据: test/*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作