five

Xerv-AI/Conversational-2K-SimpleEnglish

收藏
Hugging Face2025-12-06 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/Xerv-AI/Conversational-2K-SimpleEnglish
下载链接
链接失效反馈
官方服务:
资源简介:
--- pretty_name: Conversational Simple-English 2K Micro license: mit language: - en task_categories: - text-generation tags: - simple-english - conversational - dialogue - chat-data - beginner-friendly - small-dataset - finetuning - instruction-tuning - micro-model - xerv-ai - xerv-micro-series size_categories: - 1K<n<10K dataset_info: train: num_rows: 2000 num_columns: 3 --- # 🗣️ Conversational Simple-English 2K Micro A clean, friendly, and highly consistent 2,000-entry conversational dataset written in **simple, everyday English** – perfect for training tiny to medium-sized chat models (10M–150M parameters), quick finetuning experiments, and beginner-friendly AI projects. ## ⭐ Why this dataset rocks for small models - Extremely easy to learn – models converge fast with almost no overfitting - Short, natural turns (just like real casual chat) - Zero toxic or complex content – safe by design - Consistent instruction → output format - Ideal for micro-LLMs, mobile bots, edge devices, and classroom demos ## 📚 Dataset Structure (Alpaca-style) | Field | Description | Example Content | |-------------|------------------------------|------------------------------------------| | `instruction` | User message | "Hey, how's your day going?" | | `input` | Always empty | `""` | | `output` | Friendly assistant response | "Not bad! Just chilling with some coffee. You?" | ## 🧩 Topics (all light & positive) - Greetings & daily check-ins - Weekend plans - Weather & small talk - Food, snacks, coffee, tacos - Gaming, hobbies, parties - Casual work/school chats - Short polite exchanges No politics, no sensitive topics, no long monologues – just natural, beginner-friendly conversation. ## 📦 Stats - **Rows:** 2,000 - **Format:** JSONL - **Language:** English (simple vocabulary & grammar) - **Average turn length:** ~12–25 tokens ## 🔥 Best for - Finetuning 10M–150M parameter models - Building lightweight chatbots - Teaching LLM finetuning - Rapid prototyping & experiments - ESL (English learning) assistants - On-device / edge AI ## Part of the Xerv Micro-Series Day 1 release of the **XervAI Micro-Series** – a growing collection of tiny, high-quality datasets and models built for indie developers, researchers, and learners. ## 📜 License **MIT License** – completely free for commercial and research use (with attribution). ## 🙌 Creator **Xerv-AI** – making powerful AI accessible, one micro-dataset at a time. ❤️ Like it? Give it a star ↑ and follow **Xerv-AI** for more tiny-but-mighty datasets and models!

--- pretty_name: 对话式简易英语2K微型数据集 license: MIT许可证 language: - 英语 task_categories: - 文本生成 tags: - 简易英语 - 对话式 - 对话 - 聊天数据 - 新手友好 - 小体量数据集 - 微调 - 指令微调 - 微型模型 - xerv-ai - xerv-micro-series size_categories: - 1K<n<10K dataset_info: train: num_rows: 2000 num_columns: 3 --- # 🗣️ 对话式简易英语2K微型数据集 这是一份整洁友好、高度规范的2000条对话数据集,采用**简易日常英语**撰写,非常适合训练中小规模聊天模型(参数规模10M–150M)、快速微调实验以及面向新手的AI项目。 ## ⭐ 为何该数据集适配小型模型 - 极易上手:模型收敛速度极快,几乎无过拟合风险 - 对话回合简短自然,贴合真实日常闲聊场景 - 无任何有害或复杂内容,设计上保障安全性 - 指令→输出的格式高度统一规范 - 完美适配微型大语言模型、移动机器人、边缘设备以及课堂演示 ## 📚 数据集结构(Alpaca风格) | 字段名 | 描述 | 示例内容 | |-------------|-----------------------|-------------------------------------------| | `"instruction"` | 用户消息 | "嘿,今天过得怎么样?" | | `"input"` | 始终为空 | `""` | | `"output"` | 友好的助手回复 | "还不错!正喝着咖啡放松呢,你呢?" | ## 🧩 话题(均轻松积极) - 问候与日常寒暄 - 周末计划 - 天气与闲聊 - 美食、零食、咖啡、塔可 - 游戏、爱好、聚会 - 日常工作/校园闲聊 - 简短礼貌的交流 无政治、敏感话题或长篇独白,仅保留自然、适合新手的对话。 ## 📦 统计信息 - **行数:** 2000 - **格式:** JSONL - **语言:** 英语(词汇与语法简易) - **平均回合长度:** 约12–25个Token ## 🔥 适用场景 - 微调10M–150M参数的模型 - 构建轻量级聊天机器人 - 教学大语言模型微调流程 - 快速原型开发与实验 - ESL(英语学习)助手 - 端侧/边缘AI ## 属于Xerv微型系列数据集 本数据集是**XervAI微型系列**的首日发布内容——该系列正在持续扩充,面向独立开发者、研究者与学习者打造一系列微型高质量数据集与模型。 ## 📜 许可证 **MIT许可证**——可免费用于商业与研究用途(需注明原作者)。 ## 🙌 创作者 **Xerv-AI**——以每一份微型数据集为起点,让强大AI触手可及。 ❤️ 喜欢本数据集?请点亮Star ↑ 并关注 **Xerv-AI**,获取更多小巧却强大的数据集与模型!
提供机构:
Xerv-AI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作