five

THEARTISTISME/tradeguru-electrical-sft

收藏
Hugging Face2026-03-19 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/THEARTISTISME/tradeguru-electrical-sft
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: messages list: - name: content dtype: string - name: role dtype: string splits: - name: train num_bytes: 3021564 num_examples: 3043 download_size: 1331200 dataset_size: 3021564 configs: - config_name: default data_files: - split: train path: data/train-* --- # TradeGuru Electrical Fault-Finding SFT Dataset Synthetic training data for fine-tuning **Google Gemma 3 27B** as a specialised electrical fault-finding assistant for the **TradeGuru** iOS app. ## Dataset Details - **Examples**: 3,043 conversation pairs - **Format**: Gemma SFT (`messages` column with `user`/`model` roles) - **Model responses**: Structured JSON matching the TradeGuru iOS app `ContentBlock` schema ## Source Knowledge - 127-page professional electrical fault-finding guide covering domestic, commercial, and industrial domains - 522 practical training summaries across 18 categories (testing, wiring, tools, earthing, safety, and more) ## Categories Covered (26) Electrical basics, safety/PPE, LOTO, fault-finding process, testing equipment, CAT ratings, domestic (RCD faults, no power, breaker tripping, hot water), commercial (HVAC, emergency lighting, power distribution), industrial (motors, PLCs, sensors), wiring (switches, power points), earthing, cable work, tools, apprentice skills, 3-phase, roof work, switchboards. ## Response Format Model responses are valid JSON objects with a `blocks` array containing typed content blocks: ```json {"blocks": [ {"type": "text", "content": "..."}, {"type": "step_list", "title": "...", "steps": ["...", "..."]}, {"type": "warning", "content": "..."}, {"type": "callout", "content": "...", "style": "tip"} ]} ``` **Block types**: text, heading, step_list, warning, code, parts_list, regulation, callout, table, link ## Generation - Generated via GoodWork swarm (Z.AI / NullClaw) with parallel agent orchestration - Post-processed with validation pipeline: JSON schema checks, deduplication, compliance filtering - Quality-filtered from 15,032 raw pairs down to 3,043 unique validated examples ## Usage ```python from datasets import load_dataset dataset = load_dataset("THEARTISTISME/tradeguru-electrical-sft") ```

数据集信息: 特征: - 名称:messages 列表结构: - 名称:content 数据类型:string - 名称:role 数据类型:string 数据集划分: - 名称:train 字节数:3021564 样本数量:3043 下载大小:1331200 数据集总大小:3021564 配置项: - 配置名称:default 数据文件: - 划分:train 路径:data/train-* # TradeGuru电气故障排查SFT(Supervised Fine-Tuning,监督微调)数据集 本数据集为针对**Google Gemma 3 27B**模型进行微调的合成训练数据,旨在将其打造为适配**TradeGuru** iOS应用的专业电气故障排查AI智能体(AI Agent)。 ## 数据集详情 - **样本数量**:3043组对话样本对 - **格式**:适配Gemma监督微调的标准格式,包含`messages`列,其中标注了`user`与`model`两种角色 - **模型输出规范**:需符合TradeGuru iOS应用`ContentBlock`(内容块)架构的结构化JSON数据 ## 来源知识库 - 127页专业电气故障排查指南,覆盖民用、商用及工业三大应用场景 - 涵盖18个类别的522份实用培训摘要,涉及测试、布线、工具、接地、安全等多个领域 ## 覆盖类别(共26类) 电气基础、安全与个人防护装备(PPE,Personal Protective Equipment)、上锁挂牌(LOTO,Lockout/Tagout)、故障排查流程、测试设备、CAT评级、民用场景(剩余电流装置故障、无供电、断路器跳闸、热水系统故障等)、商用场景(暖通空调、应急照明、配电系统等)、工业场景(电机、可编程逻辑控制器(PLC,Programmable Logic Controller)、传感器等)、布线(开关、电源插座等)、接地系统、电缆作业、工具使用、学徒技能、三相电、屋顶作业、配电盘等。 ## 输出格式规范 模型输出需为合法JSON对象,包含`blocks`数组,数组内为带类型标识的内容块: json {"blocks": [ {"type": "text", "content": "..."}, {"type": "step_list", "title": "...", "steps": ["...", "..."]}, {"type": "warning", "content": "..."}, {"type": "callout", "content": "...", "style": "tip"} ]} 支持的块类型包括:文本、标题、步骤列表、警告、代码、物料清单、法规、提示框、表格、链接。 ## 生成流程 - 本数据集通过GoodWork集群(Z.AI / NullClaw)结合并行智能体编排技术生成 - 后续通过验证流水线进行后处理:包括JSON schema校验、去重、合规性筛选 - 从原始的15032组样本中经过质量筛选,最终保留3043组经过验证的唯一有效样本 ## 使用方法 python from datasets import load_dataset dataset = load_dataset("THEARTISTISME/tradeguru-electrical-sft")
提供机构:
THEARTISTISME
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作