five

fineweb-edu-llama3-annotations

收藏
魔搭社区2026-01-06 更新2025-12-06 收录
下载链接:
https://modelscope.cn/datasets/HuggingFaceFW/fineweb-edu-llama3-annotations
下载链接
链接失效反馈
官方服务:
资源简介:
## Annotations for 📚 FineWeb-Edu classifier This dataset contains the annotations used for training 📚 [FineWeb-Edu](https://huggingface.co/datasets/HuggingFaceFW/fineweb-edu) educational quality [classifier](https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier). We prompt [Llama-3-70B-Instruct](https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct) to score web pages from 🍷 [FineWeb]() based on their educational value. **Note:** the dataset contains the FineWeb text sample, the prompt (using the first 1000 characters of the text sample) and the scores but it doesn't contain the full Llama 3 generation.

📚 FineWeb-Edu分类器的标注数据集说明 本数据集包含用于训练📚 FineWeb-Edu教育质量分类器(classifier,模型链接:https://huggingface.co/HuggingFaceFW/fineweb-edu-classifier)的标注数据,其中FineWeb-Edu数据集的官方链接为https://huggingface.co/datasets/HuggingFaceFW/fineweb-edu。我们向Llama-3-70B-Instruct(模型链接:https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct)发起提示请求,依据教育价值对🍷 FineWeb数据集(链接未提供)中的网页样本进行评分。 **注意:** 本数据集包含FineWeb文本样本、提示词(采用文本样本的前1000个字符)以及评分结果,但不包含完整的Llama 3生成输出。
提供机构:
maas
创建时间:
2025-09-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作