five

chatelet/distil-10k

收藏
Hugging Face2025-08-16 更新2025-11-29 收录
下载链接:
https://hf-mirror.com/datasets/chatelet/distil-10k
下载链接
链接失效反馈
官方服务:
资源简介:
Distil 10k是一个包含10k条英文自然语言提示的数据集,覆盖了广泛的领域,这些提示是由GPT-5生成的,并由人类进行了审核。该数据集主要用于将大型模型压缩成更小的模型。数据集包含的领域有创意写作、代码生成、数学问题解决、翻译、推理与逻辑、科学解释、历史分析、角色扮演与对话模拟、观点与辩论、指导手册、伦理与道德、商业与战略、技术文档、教育评估和幽默与娱乐等。

Distil 10k is a dataset of 10k English natural language prompts across a wide range of domains, synthetically generated by GPT-5 and reviewed by humans, primarily intended for distillation of large models into smaller ones. The dataset covers domains such as Creative Writing, Code Generation, Mathematical Problem Solving, Translation, Reasoning & Logic, Scientific Explanation, Historical Analysis, Roleplay & Dialogue Simulation, Opinion & Debate, Instructional Guides, Ethics & Morality, Business & Strategy, Technical Documentation, Educational Assessment, and Humour & Entertainment.
提供机构:
chatelet
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作