FineTome-100k

Name: FineTome-100k
Creator: maas
Published: 2026-04-24 16:49:56
License: 暂无描述

魔搭社区2026-04-24 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/AI-ModelScope/FineTome-100k

下载链接

链接失效反馈

官方服务：

资源简介：

# FineTome-100k ![image/jpeg](https://cdn-uploads.huggingface.co/production/uploads/61b8e2ba285851687028d395/75I3ffI4XnRlheOQ7kNJ3.jpeg) The FineTome dataset is a subset of [arcee-ai/The-Tome](https://huggingface.co/datasets/arcee-ai/The-Tome) (without arcee-ai/qwen2-72b-magpie-en), re-filtered using [HuggingFaceFW/fineweb-edu-classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier). It was made for my article ["Fine-tune Llama 3.1 Ultra-Efficiently with Unsloth"](https://huggingface.co/blog/mlabonne/sft-llama3).

# FineTome-100k ![image/jpeg](https://cdn-uploads.huggingface.co/production/uploads/61b8e2ba285851687028d395/75I3ffI4XnRlheOQ7kNJ3.jpeg) FineTome数据集是[arcee-ai/The-Tome](https://huggingface.co/datasets/arcee-ai/The-Tome)的子集（已移除arcee-ai/qwen2-72b-magpie-en），并通过[HuggingFaceFW/fineweb-edu-classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier)完成二次过滤。本数据集专为我的博文《使用Unsloth超高效微调Llama 3.1》（https://huggingface.co/blog/mlabonne/sft-llama3）打造。

提供机构：

maas

创建时间：

2024-08-02

搜集汇总

数据集介绍

背景与挑战

背景概述

FineTome-100k是一个基于arcee-ai/The-Tome数据集重新过滤的子集，排除了arcee-ai/qwen2-72b-magpie-en部分，并使用HuggingFaceFW/fineweb-edu-classifier进行优化筛选。该数据集专为高效微调Llama 3.1模型而设计，支持文章'Fine-tune Llama 3.1 Ultra-Efficiently with Unsloth'中的实验和应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集