five

open-concept-steering/OLMo-2_Residual_Streams

收藏
Hugging Face2025-06-09 更新2025-08-30 收录
下载链接:
https://hf-mirror.com/datasets/open-concept-steering/OLMo-2_Residual_Streams
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了大约6亿个从FineWeb数据集的子集运行OLMo-2-1124-7B-Instruct模型得到的残差流。这些残差流使用uint16格式保存,但在使用前需要转换为bfloat16格式。数据集来源于FineWeb数据集的train分区的sample-10BT子集,使用的是AllenAI的OLMo-2-1124-7B-Instruct模型。数据以.parquet文件格式存储,未经归一化处理。

This dataset contains approximately 600 million residual streams derived from running the OLMo-2-1124-7B-Instruct model on a subset of the FineWeb dataset. These residual streams are saved in uint16 format but need to be cast to bfloat16 format before use. The dataset is sourced from the sample-10BT subset of the train split of the FineWeb dataset, using the AllenAI OLMo-2-1124-7B-Instruct model. The data is stored in .parquet file format and has not been normalized.
提供机构:
open-concept-steering
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作