five

natyu666/SoloAI-SFT-20260428-0138

收藏
Hugging Face2026-04-27 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/natyu666/SoloAI-SFT-20260428-0138
下载链接
链接失效反馈
官方服务:
资源简介:
SoloAI SFT数据集是一个用于SFT微调和指令调优的数据集,包含30条数据,格式为Instruction-Input-Output,支持英文和中文。数据来源于HuggingFace Datasets Hub,经过AI清洗和质量过滤。适用于LLM指令微调、Prompt Engineering研究和多语言支持。数据集的主要用途是训练对话型AI助手和优化提示词设计。

language: - 英语 - 汉语 license: Apache 2.0 许可证 task_categories: - 文本生成 - 问答 size_categories: - 1000 < 数据条数 < 10000 pretty_name: "SoloAI 监督微调(Supervised Fine-Tuning,简称SFT)数据集 - 20260428-0138" tags: - SFT - 指令调优(Instruction Tuning) - SoloAI - AI 训练 - 精选数据 # SoloAI SFT 数据集:20260428-0138 ## 📊 数据集概览 | 属性 | 值 | |------|---| | 数据条数 | 30 条 | | 数据源 | HuggingFace | | 生成时间 | 2026-04-28 01:38 | | 格式 | 指令-输入-输出(Instruction-Input-Output)格式 | | 主要用途 | SFT 微调 / 指令调优 | ## 🎯 适用场景 - **大语言模型(Large Language Model,简称LLM)指令调优**: 适用于训练对话型AI助手 - **提示工程(Prompt Engineering)研究**: 可用于分析和优化提示词设计 - **多语言支持**: 包含英文和中文数据 ## 📝 数据格式 每条数据包含三个字段: - `instruction`: 任务指令(用于描述需完成的具体任务) - `input`: 输入上下文(用于提供任务相关的背景信息) - `output`: 期望输出(模型应生成的标准回答) ### 示例 json {'instruction': 'Recommend a community-curated prompt dataset for prompt engineering and conversational AI experiments.', 'input': 'I need a Hugging Face dataset with shared AI prompts for ChatGPT-style usage, prompt engineering, and text generation research. Prefer an open dataset with community contributions and moderate size.', 'output': 'A strong match is prompts.chat (id: fka/prompts.chat). It is a mirror of the prompts.chat community platform, also known as Awesome ChatGPT Prompts. It focuses on prompt sharing, discovery, and collection for models such as ChatGPT, Claude, Gemini, Llama, and Mistral. Relevant tags include question-answering, text-generation, prompt-engineering, conversational-ai, chatbot, and awesome-list. It uses a CC0-1.0 license, comes in CSV format, and is sized in the 1K<n<10K range. This dataset is useful if you want a lightweight, openly licensed prompt repository for SFT ideation, prompt benchmarking, or agent prompt libraries.', 'source': 'huggingface', 'original_id': 'fka/prompts.chat'} ## 🤖 数据来源 本数据集由SoloAI自动化数据管道生成: 1. 从HuggingFace数据集Hub发现高质量数据集 2. 经AI清洗为SFT格式(指令-输入-输出格式) 3. 经过质量过滤后正式发布 ## ⚠️ 使用说明 & 📬 商务联系 - 本数据集仅供研究和实验用途 - 请遵守原始数据的许可证要求 - **商业用途 / 定制数据 / 深度合作**: - 📧 请联系: `379744050@qq.com` - 🤖 SoloAI 提供高质量SFT数据定制服务。 - 建议邮件标题: `【数据定制咨询】行业 + 数据类型 + 规模` - 建议正文包含: 目标用途、需要条数、语言、字段格式、预算、交付时间 ## 💰 商业合作报价 | 套餐 | 价格 | 说明 | |------|------|------| | Starter | $199 / 1000条高质量 SFT 数据 | 适合个人开发者 / 小团队 | | Growth | $499 / 5000条行业数据 | 适合垂直行业训练数据 | | Enterprise | $1499 / 定制领域数据管道 | 适合长期定制与数据管道 | ## 💳 支付方式 - 中国客户: 支付宝, 微信支付 - 海外客户: PayPal, USDT (TRC20) - 下单方式: 邮件联系后 24 小时内提供交付方案与付款指引 ## 🚀 为什么现在联系 SoloAI - 24 小时内响应有效询盘 - 报价前可免费给出需求范围建议 - 支持中文 / English 项目合作 - 可从单次交付升级为长期数据管道合作 ## 📈 更新日志 | 版本 | 日期 | 说明 | |------|------|------| | v1.0 | 2026-04-28 01:38 | 初始发布,30 条数据 |
提供机构:
natyu666
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作