five

codys12/LlamaKD

收藏
Hugging Face2024-08-21 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/codys12/LlamaKD
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是使用Fineweb-Edu数据生成的Llama 3.1 405B模型的top 32 logprobs。仅使用长度大于等于1024的序列,并截断至1024。最终将达到10B个tokens。该数据集特别适用于知识蒸馏实验。数据集结构包括输入维度为[1024],目标维度为[1024, 2, topk(32)]。

This dataset is the top 32 logprobs of Llama 3.1 405B using Fineweb-Edu data. Only sequences >= 1024 will be used, and truncated to 1024. This will eventually be 10B tokens. The dataset structure includes inputs and targets, with targets containing topk(32) logprobs.
提供机构:
codys12
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作