five

kothasuhas/llama-3b-gold-15M-student-generations_SNIS_2048_tune422v1_N15.00M_T32.0

收藏
Hugging Face2025-04-26 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/kothasuhas/llama-3b-gold-15M-student-generations_SNIS_2048_tune422v1_N15.00M_T32.0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本数据,以及对数权重和两种采样概率。它分为训练集和验证集,其中训练集包含1500万条示例,验证集包含1000条示例。

The dataset includes text data, logarithmic weights, and two types of sampling probabilities. It is split into a training set with 15 million examples and a validation set with 1,000 examples.
提供机构:
kothasuhas
二维码
社区交流群
二维码
科研交流群
商业服务