five

empero-ai/tasklist-gemma4b-10000x-unfiltered

收藏
Hugging Face2026-04-04 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/empero-ai/tasklist-gemma4b-10000x-unfiltered
下载链接
链接失效反馈
官方服务:
资源简介:
# TaskGen Dataset > Generated with **taskgen** by [empero-ai](https://github.com/empero-org) ## Run Parameters | Parameter | Value | |---|---| | Model | `google/gemma-4-26b-a4b-it` | | Temperature | `0.9` | | Total Tasks | 9996 | | Concurrency | 10 workers | | API Base | `https://openrouter.ai/api/v1` | | Generated | 2026-04-04 02:05:28 | ## Domain Distribution | Domain | Weight | |---|---| | coding | 25.0% | | math | 25.0% | | science | 15.0% | | cs | 15.0% | | creative | 10.0% | | conversation | 10.0% | ## Difficulty Distribution | Level | Label | Weight | |---|---|---| | 1 | Very Easy (child-level) | 5.0% | | 2 | Easy (elementary) | 5.0% | | 3 | Basic (middle school) | 10.0% | | 4 | Intermediate (high school) | 15.0% | | 5 | Standard (undergraduate intro) | 20.0% | | 6 | Skilled (undergraduate advanced) | 15.0% | | 7 | Proficient (graduate level) | 10.0% | | 8 | Advanced (professional/researcher) | 8.0% | | 9 | Expert (top specialist) | 7.0% | | 10 | Polymath (1-in-a-million genius) | 5.0% | ## Token Usage | Metric | Value | |---|---| | Input Tokens | 2735928 | | Output Tokens | 1176735 | | Total Tokens | 3912663 | ## Output Format Each line in the JSONL file contains: ```json { "prompt": "...", "domain": "math::Algebra", "subdomain": "polynomials", "difficulty": 5, "taskgen_model": "gpt-4o-mini", "temperature": 0.9 } ``` ## Support / Donate If this tool helped you, consider supporting the project: - **BTC**: `bc1qx6zepu6sfkvshgdmc4ewu6pk6rpadvpgffpp7v` - **LTC**: `ltc1qv2mefzps2vtjcpwfx8xxdrpplrcvltswm68r7x` - **XMR**: `42Dbm5xg5Nq26fdyzfEU7KBnAJfhi7Cvz5J2ex5CzHXkfKuNEJzYCcmJ1GTbgjFZ5MBx72sdG1G9239Cd6rsZfv4QeDkYJY` --- *Built with [taskgen](https://github.com/empero-org/taskgen) by empero-ai*

# 任务生成(TaskGen)数据集 > 本数据集由[empero-ai](https://github.com/empero-org)基于**任务生成工具(taskgen)**生成 ## 运行参数 | 参数 | 参数值 | |---|---| | 模型 | `google/gemma-4-26b-a4b-it` | | 温度系数 | `0.9` | | 总任务数 | 9996 | | 并发工作线程数 | 10 | | API接口地址 | `https://openrouter.ai/api/v1` | | 生成时间 | 2026-04-04 02:05:28 | ## 领域分布 | 领域 | 权重占比 | |---|---| | 编码 | 25.0% | | 数学 | 25.0% | | 科学 | 15.0% | | 计算机科学(CS) | 15.0% | | 创意创作 | 10.0% | | 对话交互 | 10.0% | ## 难度分布 | 难度等级 | 难度标签 | 权重占比 | |---|---|---| | 1 | 极简单(儿童级) | 5.0% | | 2 | 简单(小学阶段) | 5.0% | | 3 | 基础(初中阶段) | 10.0% | | 4 | 中等(高中阶段) | 15.0% | | 5 | 标准(本科入门级) | 20.0% | | 6 | 熟练(本科高级阶段) | 15.0% | | 7 | 精通(研究生阶段) | 10.0% | | 8 | 高阶(专业/研究级) | 8.0% | | 9 | 专家(顶级专精者) | 7.0% | | 10 | 通才(百万分之一的天才) | 5.0% | ## Token使用统计 | 统计指标 | 数值 | |---|---| | 输入Token数 | 2735928 | | 输出Token数 | 1176735 | | 总Token数 | 3912663 | ## 输出格式 本数据集的JSONL格式文件中,每一行均为如下结构的JSON对象: json { "prompt": "...", "domain": "math::Algebra", "subdomain": "polynomials", "difficulty": 5, "taskgen_model": "gpt-4o-mini", "temperature": 0.9 } ## 支持与捐赠 若本工具对你有所帮助,可通过以下方式支持该项目: - **BTC**: `bc1qx6zepu6sfkvshgdmc4ewu6pk6rpadvpgffpp7v` - **LTC**: `ltc1qv2mefzps2vtjcpwfx8xxdrpplrcvltswm68r7x` - **XMR**: `42Dbm5xg5Nq26fdyzfEU7KBnAJfhi7Cvz5J2ex5CzHXkfKuNEJzYCcmJ1GTbgjFZ5MBx72sdG1G9239Cd6rsZfv4QeDkYJY` --- *本数据集基于[taskgen](https://github.com/empero-org/taskgen)工具由empero-ai构建*
提供机构:
empero-ai
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作