CADE

Hugging Face2025-03-13 更新2025-03-14 收录

下载链接：

https://huggingface.co/datasets/aequa-tech/CADE

下载链接

链接失效反馈

官方服务：

资源简介：

CADE数据集是在研究项目`That is Unacceptable: the Moral Foundations of Canceling'的背景下创建的。这是一个针对取消行为态度的标注语料库，旨在探索评估社交媒体上取消态度的分歧因素。特别是，本研究调查了标注者的道德观念在其对取消行为的认知中的影响，显示道德是解释这种现象分歧的一个独立维度。标注者的判断严重依赖于争议事件类型和涉及的名人。这表明需要开发以事件为中心的数据集，以更好地理解社交媒体中伤害是如何实施的，并开发更具有洞察力的技术来检测它们。

The CADE dataset was developed in the context of the research project *That is Unacceptable: the Moral Foundations of Canceling*. It is an annotated corpus of attitudes toward canceling behavior, designed to explore the factors underlying divergent assessments of attitudes toward canceling on social media. Specifically, this study examines the influence of annotators' moral beliefs on their perceptions of canceling behavior, demonstrating that morality serves as an independent dimension for explaining the divisions surrounding this phenomenon. Annotators' judgments rely heavily on the type of controversial event and the celebrities involved. This underscores the need for event-centric datasets to better understand how harm is perpetrated on social media, as well as to develop more insightful techniques for detecting such harm.

创建时间：

2025-03-13

搜集汇总

数据集介绍

构建方式

CADE数据集是在研究项目`That is Unacceptable: the Moral Foundations of Canceling'背景下构建的。该数据集通过收集并标注社交媒体上取消文化现象的相关事件，形成了一个注释语料库。数据集中每个样本均包含文本ID、目标、文本内容、注释者ID、利益相关者、立场、可接受性、样本、评论等字段，以及性别认同和道德基础理论相关的特征。数据集的构建依赖于对社交媒体取消事件的多维度标注，旨在探究评价取消态度的分歧因素。

特点

CADE数据集的特点在于其深度标注的属性，涵盖了立场、可接受性、取消文化态度等多个维度，并引入了道德基础理论的视角。该数据集具有10K至100K的规模，以英语为主要语言，不仅适用于文本分类任务，还包含了与取消文化、仇恨言论、道德基础理论等相关标签，有助于深入研究社交媒体中的有害行为及其背后的社会心理机制。

使用方法

用户可以通过HuggingFace提供的平台下载CADE数据集，并根据具体的研究或开发需求，利用其提供的 splits 进行训练、验证和测试。数据集的配置文件支持按需加载数据，使用户能够灵活地选择训练集。在应用该数据集时，建议遵循数据使用协议，并在研究成果中引用相关的工作，以尊重数据集的版权和知识产权。

背景与挑战

背景概述

CADE（Canceling Attitudes Detection）数据集是在研究项目`That is Unacceptable: the Moral Foundations of Canceling'的背景下创建的，该项目由Soda Marem Lo、Oscar Araque、Rajesh Sharma和Marco Antonio Stranisci等研究人员于2025年共同完成。该数据集的核心研究问题是探索社交媒体上取消文化现象的态度检测，旨在研究评价者在评价社交媒体上的取消态度时，其道德观对其判断的影响。CADE数据集的构建，为理解取消文化现象背后的道德基础提供了重要资源，对社交媒体平台的安全发展及意识形态极化现象的研究具有显著影响力。

当前挑战

在领域问题上，CADE数据集面临的挑战包括如何准确识别和量化社交媒体中取消态度的道德基础及其复杂性。在构建过程中，数据集的挑战主要体现在如何确保标注质量，特别是在处理涉及争议事件和公众人物时，标注者的主观判断可能影响数据的客观性。此外，数据集在标注过程中还需考虑如何平衡不同事件类型和不同标注者之间的道德判断差异，这对于提高数据集的实用性和可靠性至关重要。

常用场景

经典使用场景

在文本分类研究领域，CADE数据集以其独特的角度，被广泛应用于检测和评估社交媒体上取消文化态度的实例。该数据集通过标注取消事件的相关特征，如立场、可接受性、道德基础等，为研究者提供了一个深入分析取消文化现象的多维度视角。

解决学术问题

CADE数据集解决了如何量化社交媒体上取消文化现象中的道德争议问题，以及如何评估不同注释者在面对争议性事件时的道德判断差异。它的构建为理解社交媒体中的伤害行为提供了新的视角，并为开发更加敏感的技术以检测这些行为提供了基础。

衍生相关工作

基于CADE数据集，研究者可以开展一系列相关的工作，如进一步探索取消文化的心理学基础，开发更加精细化的取消态度预测模型，以及设计用于道德教育的人工智能助手等。这些衍生工作将进一步丰富该领域的研究内容，并对社会实践产生积极影响。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集