five

Euphemism Dataset

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Euphemism_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
委婉语是温和或间接的表达,用于代替更严厉或更具攻击性的表达。委婉语常用于以礼貌的方式掩盖亵渎或指代诸如死亡、残疾、性、宗教或个人关系等禁忌话题。委婉语通常是模棱两可的: 它们的字面解释和非字面解释取决于上下文: 当被要求在工作和环境之间进行选择时,大多数人 (至少在我们扭曲的,先过后的系统中) 将选择工作。[非委婉的] vs。今年夏天,崭露头角的人才经纪人几乎在任何时候都可以自由照看孩子。[委婉的] 最先进的语言模型在许多主要的NLP基准上都表现良好; 但是,尚不清楚此类模型在委婉语中的表现如何。因此,我们提出了一个委婉语检测任务: 给定一个输入句子,识别该句子是否包含委婉语。
提供机构:
OpenDataLab
创建时间:
2022-11-18
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Euphemism Dataset是由卡内基梅隆大学于2022年发布的委婉语检测数据集,用于评估语言模型在识别委婉语方面的能力。委婉语是温和或间接的表达,常用于替代更严厉或更具攻击性的表达,该数据集旨在填补语言模型在委婉语理解方面的评估空白。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作