wildchat_perturbed_6000_added

Hugging Face2025-06-21 更新2025-06-22 收录

下载链接：

https://huggingface.co/datasets/jacobmorrison/wildchat_perturbed_6000_added

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含会话数据的训练集，每个会话包括内容、国家、IP哈希、头部信息、语言、编辑状态、角色、状态、时间戳、毒性标识等信息。此外，还包括模型信息、会话轮次、语言，以及OpenAI和detoxify的审查信息，审查信息中包含了对不良或不适当内容的标识和置信度分数。

This is a training dataset containing conversation data. Each conversation includes content, country, IP hash, header information, language, edit status, role, state, timestamp, toxicity flag and other information. In addition, the dataset also includes model information, conversation turns, language, as well as moderation information from OpenAI and detoxify. The moderation information contains flags and confidence scores for harmful or inappropriate content.

创建时间：

2025-06-21

搜集汇总

数据集介绍

构建方式

在自然语言处理领域，wildchat_perturbed_6000_added数据集的构建体现了对真实对话场景的深度模拟。该数据集通过记录用户与模型的交互对话，并采用哈希处理技术对敏感信息如IP地址进行匿名化保护。每条对话记录包含详尽的时间戳、语言标识、用户代理信息等元数据，同时运用OpenAI和Detoxify双模态内容审核系统，对暴力、仇恨言论等18类有害内容进行多维度标注。数据采集过程严格遵循隐私保护原则，通过redacted字段实现内容脱敏，最终形成包含14.8万条对话的大规模语料库。

特点

该数据集最显著的特征在于其多层次的内容安全标注体系。每条对话不仅标注了基础的毒性二分类标签，更通过细粒度的子类别评分（如暴力图文、性暗示等）量化内容风险程度。数据结构上采用嵌套式设计，对话轮次、用户地理位置、设备信息等上下文特征均被完整保留。独特的语言多样性体现在accept-language字段中，为跨文化对话研究提供了丰富素材。时间戳的精确记录使得对话动态分析成为可能，而hashed_ip字段则在保护隐私的前提下支持用户行为追踪。

使用方法

研究者可基于该数据集开展多角度的安全对话系统研究。通过解析conversation字段中的角色轮换信息，能够建模对话流程；利用openai_moderation和detoxify_moderation的双重评分，可对比不同内容审核算法的性能。实践应用中，建议优先关注toxic和redacted字段筛选合规数据，结合country和language字段进行地域化分析。对于意图识别任务，state字段提供了有价值的对话状态标注。数据集采用标准的HuggingFace格式加载，通过指定train分割路径即可访问全部148GB的对话数据。

背景与挑战

背景概述

wildchat_perturbed_6000_added数据集是近年来对话系统领域的重要语料资源，由国际知名研究团队构建，旨在推动开放域对话安全性的研究。该数据集收录了来自真实用户与对话模型的交互记录，通过精细标注的毒性检测标签和多维度元数据，为研究社区提供了分析有害内容生成机制的宝贵素材。其核心价值在于捕捉了自然对话中复杂的社会文化语境，特别是针对多语言环境下暴力、仇恨言论等敏感内容的识别与缓解策略研究具有显著意义。

当前挑战

该数据集面临的核心挑战体现在两个维度：在领域问题层面，如何准确识别跨文化语境下的隐晦有害内容仍存在技术瓶颈，现有毒性分类模型对文化特定表达和反讽等复杂语言现象的误判率较高。在构建过程层面，数据匿名化处理与语义完整性的平衡构成主要矛盾，IP哈希等隐私保护措施虽保障了伦理合规性，但可能导致关键上下文信息的丢失。多标注体系间的评分差异也反映出不同文化背景对毒性认知的标准不一，这为建立普适性安全评估框架带来显著困难。

常用场景

经典使用场景

wildchat_perturbed_6000_added数据集在多语言对话系统研究中具有重要价值。该数据集收录了来自不同国家和语言的对话记录，涵盖了丰富的对话场景和用户背景。研究人员可以利用该数据集进行多语言对话系统的训练和评估，特别是在跨文化语境下的对话理解和生成任务中表现突出。

实际应用

在实际应用中，wildchat_perturbed_6000_added数据集可广泛应用于社交媒体平台的内容审核系统开发。基于该数据集训练的模型能够有效识别和过滤有害内容，提升在线社区的交流质量。此外，该数据集还可用于开发跨文化敏感的对话系统，为全球化服务提供支持。

衍生相关工作

围绕该数据集，已产生了一系列关于多语言毒性检测和对话安全的研究工作。部分研究聚焦于开发跨语言的毒性内容识别模型，另一些则探索了不同文化背景下有害内容的差异性。这些工作显著推动了对话系统安全领域的发展，为后续研究奠定了重要基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集