WorkplaceDispute
收藏Hugging Face2026-04-18 更新2026-04-19 收录
下载链接:
https://huggingface.co/datasets/CDividends/WorkplaceDispute
下载链接
链接失效反馈官方服务:
资源简介:
HR Workplace Conflict Dialogue Dataset 是一个合成的职场冲突对话数据集,涵盖42种违规类别,包括工资盗窃、骚扰、歧视、报复、FMLA违规、ADA不合规等。该数据集旨在用于微调HR合规模型、冲突解决AI、情感分析和职场安全分类器。数据集包含500条预览记录和5,000条完整记录,格式为JSONL(每行一个JSON对象),语言为英语。每条记录包含冲突类型、严重程度、行业、参与者、对话、解决状态和质量评分等字段。数据集通过GPT-3.5-turbo生成,并经过清理、验证、严重性标记和质量评分等后处理。适用于HR合规聊天机器人、冲突检测与分类模型、情感分析、升级预测系统以及组织行为学术研究。数据集采用CC-BY-NC-4.0许可,仅供研究和非商业使用。
创建时间:
2026-04-18
原始信息汇总
HR Workplace Conflict Dialogue Dataset 数据集概述
数据集基本信息
- 数据集名称:HR Workplace Conflict Dialogue Dataset
- 发布平台:Hugging Face
- 数据集地址:https://huggingface.co/datasets/CDividends/WorkplaceDispute
- 语言:英语
- 许可证:CC-BY-NC-4.0(仅供研究和非商业用途)
- 数据规模(预览版):500条记录
- 完整数据集规模:5000条记录(需通过Gumroad获取)
- 数据格式:JSONL(每行一个JSON对象)
- 生成方式:使用GPT-3.5-turbo通过结构化提示生成
- 后处理:经过清洗、验证、严重性标记和质量评分
数据集内容与结构
- 核心内容:包含模拟现实工作场所冲突对话的合成数据集。
- 覆盖范围:涵盖42种违规类别,包括工资盗窃、骚扰、歧视、报复、FMLA违规、ADA不合规等。
- 数据记录字段:
conflict_type:工作场所违规类别。severity:严重程度(低/中/高/关键)。industry:随机化的工作场所环境。participants:包含姓名和职位的参与者数组。dialogue:多轮现实对话数组。resolution_status:解决状态(已解决/未解决/已升级)。quality_score:内部质量指标(0-1)。
主要用途
- 用于微调人力资源合规聊天机器人的大型语言模型。
- 训练冲突检测和分类模型。
- 工作场所环境中的情感和情绪分析。
- 构建升级预测系统。
- 组织行为的学术研究。
获取与许可说明
- 预览数据集:可通过Hugging Face页面获取。
- 完整数据集:需通过Gumroad购买(https://consumerdiv.gumroad.com/l/hr-dataset)。
- 商业许可:如需商业用途许可,需联系版权方(sawinskia23@gmail.com)。
搜集汇总
数据集介绍

构建方式
在人力资源合规与职场冲突研究领域,数据集的构建需兼顾真实性与多样性。WorkplaceDispute数据集采用GPT-3.5-turbo模型,通过结构化提示生成模拟职场冲突对话,覆盖工资盗窃、骚扰、歧视、报复等42类违规行为。生成后经过清洗、验证、严重性标注与质量评分等后处理步骤,确保每条记录在冲突类型、行业背景、参与者角色及对话逻辑上均符合现实场景,最终形成包含500条预览数据及5000条完整数据的JSONL格式语料库。
特点
该数据集的核心特点在于其全面覆盖职场违规类型与高度结构化的信息组织。除涵盖42种具体违规类别外,每条记录均标注冲突严重程度、行业背景、参与者信息、多轮对话内容及解决状态,并附有内部质量评分。对话内容模拟真实职场交流,涉及零售、科技等多种行业场景,且通过人工验证确保语义合理性与情境真实性。这种多维度的标注体系为模型训练提供了丰富的监督信号,尤其适用于细粒度分类与生成任务。
使用方法
在应用层面,该数据集主要服务于人力资源合规人工智能系统的开发与学术研究。使用者可基于JSONL格式直接加载数据,利用冲突类型与严重性标签进行多分类模型训练,或依据对话序列构建生成式合规助手。情感分析与冲突升级预测任务则可结合对话文本与解决状态字段展开。研究人员还可通过行业与参与者角色字段进行场景细分研究,但需注意数据集采用CC-BY-NC-4.0协议,仅限非商业用途,商业应用需另行获取授权。
背景与挑战
背景概述
随着人工智能技术在人力资源与合规管理领域的深入应用,对高质量、多样化职场冲突对话数据的需求日益增长。WorkplaceDispute数据集应运而生,由研究团队于近期创建,旨在通过合成对话模拟真实职场纠纷场景,涵盖工资盗窃、骚扰、歧视、报复等42类违规行为。该数据集的核心研究问题聚焦于如何利用生成式人工智能构建大规模、结构化的冲突对话语料,以支持人力资源合规模型微调、冲突解决系统开发及组织行为学术研究,对提升职场安全与合规自动化水平具有显著影响力。
当前挑战
WorkplaceDispute数据集致力于解决职场冲突检测与分类的领域挑战,包括对复杂、敏感对话中细微违规信号的识别,以及跨多种违规类别和严重程度的情感与意图分析。在构建过程中,面临合成数据真实性保障的难题,需通过结构化提示与后处理确保对话逻辑连贯、内容合规;同时,数据标注需平衡多样性、代表性及伦理边界,避免偏见引入,并维持高质评分标准,以支撑可靠模型训练。
常用场景
经典使用场景
在人力资源合规与组织行为学领域,WorkplaceDispute数据集为人工智能模型提供了丰富的训练素材。该数据集通过模拟真实职场冲突对话,涵盖了工资盗窃、骚扰、歧视等42类违规场景,常用于微调大型语言模型,以构建智能HR合规助手。这些模型能够自动识别对话中的违规内容,评估冲突严重程度,并为后续的干预措施提供数据支持,从而提升组织内部纠纷处理的效率与规范性。
实际应用
在实际应用中,该数据集被企业用于开发内部合规监测系统。通过训练分类模型,系统可实时扫描员工沟通记录,预警潜在的职场违规行为,如歧视性言论或报复性威胁。此外,它还能辅助构建冲突解决聊天机器人,为员工提供初步咨询,减轻HR部门负担。这类工具在零售、科技等行业中,有助于维护职场安全,降低法律风险。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作。例如,基于其对话结构开发的冲突严重性评估模型,能够自动标注纠纷升级风险;另有研究利用多轮对话训练情感分析器,以探测职场环境中的隐性压力。这些工作不仅扩展了数据集的用途,还促进了AI在伦理合规领域的应用,为后续的自动化调解系统奠定了技术基础。
以上内容由遇见数据集搜集并总结生成



