fineweb-edu-llama3-annotations
收藏魔搭社区2026-01-06 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/HuggingFaceFW/fineweb-edu-llama3-annotations
下载链接
链接失效反馈官方服务:
资源简介:
## Annotations for 📚 FineWeb-Edu classifier
This dataset contains the annotations used for training 📚 [FineWeb-Edu](https://huggingface.co/datasets/HuggingFaceFW/fineweb-edu) educational quality [classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier). We prompt [Llama-3-70B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct) to score web pages from 🍷 [FineWeb]() based on their educational value.
**Note:** the dataset contains the FineWeb text sample, the prompt (using the first 1000 characters of the text sample) and the scores but it doesn't contain the full Llama 3 generation.
📚 FineWeb-Edu分类器的标注数据集说明
本数据集包含用于训练📚 FineWeb-Edu教育质量分类器(classifier,模型链接:https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier)的标注数据,其中FineWeb-Edu数据集的官方链接为https://huggingface.co/datasets/HuggingFaceFW/fineweb-edu。我们向Llama-3-70B-Instruct(模型链接:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct)发起提示请求,依据教育价值对🍷 FineWeb数据集(链接未提供)中的网页样本进行评分。
**注意:** 本数据集包含FineWeb文本样本、提示词(采用文本样本的前1000个字符)以及评分结果,但不包含完整的Llama 3生成输出。
提供机构:
maas
创建时间:
2025-09-08



