five

enguyen/smollm-chunked

收藏
Hugging Face2026-03-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/enguyen/smollm-chunked
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含FAISS索引文件和分块数据集的数据集,用于SmolLM和SmolLM2语料库的新颖性检测。数据集因存储限制分布在两个不同的仓库中。

This dataset includes FAISS index files and chunked datasets for novelty detection on the SmolLM and SmolLM2 corpora. The dataset is distributed across two different repositories due to storage limitations.
提供机构:
enguyen
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作