enguyen/smollm-chunked
收藏Hugging Face2026-03-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/enguyen/smollm-chunked
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含FAISS索引文件和分块数据集的数据集,用于SmolLM和SmolLM2语料库的新颖性检测。数据集因存储限制分布在两个不同的仓库中。
This dataset includes FAISS index files and chunked datasets for novelty detection on the SmolLM and SmolLM2 corpora. The dataset is distributed across two different repositories due to storage limitations.
提供机构:
enguyen



