five

HKBU-NLP/GOAT-Bench

收藏
Hugging Face2025-04-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HKBU-NLP/GOAT-Bench
下载链接
链接失效反馈
官方服务:
资源简介:
GOAT-Bench是一个全面的、专门设计的数据集,用于通过基于模因的多模态社交滥用评估大型多模态模型。该数据集包含超过6K个多样化的模因,涵盖仇恨言论和冒犯性内容等主题。其主要目标是评估LMMs在识别在线滥用方面的能力,特别是在仇恨性、厌女症、冒犯性、讽刺性和有害性方面的准确性。此外,数据集还评估了思维链在辨别模因潜在含义以推断其安全威胁方面的有效性。数据集的使用需遵守Facebook的使用条款,并且对评估者采取了保护措施。

GOAT-Bench是一个全面的、专门设计的数据集,用于通过基于模因的多模态社交滥用评估大型多模态模型。该数据集包含超过6K个多样化的模因,涵盖仇恨言论和冒犯性内容等主题。其主要目标是评估LMMs在识别在线滥用方面的能力,特别是在仇恨性、厌女症、冒犯性、讽刺性和有害性方面的准确性。此外,数据集还评估了思维链在辨别模因潜在含义以推断其安全威胁方面的有效性。数据集的使用需遵守Facebook的使用条款,并且对评估者采取了保护措施。
提供机构:
HKBU-NLP
原始信息汇总

GOAT-Bench 数据集概述

数据集描述

GOAT-Bench 是一个综合且专业的数据集,旨在通过基于模因的多模态社交滥用评估大型多模态模型(LMMs)。该数据集包含超过 6K 个多样化的模因,涵盖仇恨言论和冒犯性内容等多种主题。数据集的主要目标是评估 LMMs 在识别在线滥用方面的能力,特别是仇恨性、性别歧视、冒犯性、讽刺和有害性。

数据集内容

  • 数据量:超过 6K 个模因
  • 主题范围:包括仇恨言论和冒犯性内容
  • 评估维度
    • 仇恨性(Hatefulness)
    • 性别歧视(Misogyny)
    • 冒犯性(Offensiveness)
    • 讽刺(Sarcasm)
    • 有害性(Harmfulness)

数据集控制

数据集对每个特定模因任务的粒度进行了细致控制,以便进行详细分析。此外,数据集还评估了思维链在识别模因潜在含义以推断其对安全的潜在威胁方面的有效性。

伦理和更广泛的影响

研究重点是解决与 LMMs 相关的安全问题,以遏制滥用模因的传播并保护个人免受偏见、种族和性别歧视的影响。数据集的使用遵循 Facebook 的条款和条件,并且不包含任何个人用户数据。

许可证

  • Misogyny, Offensiveness, Sarcasm, Harmfulness:MIT 许可证
  • Hatefulness:使用 Facebook 的仇恨模因数据集需要遵守 Facebook 的条款和条件。GOAT-Bench 仅包含 Facebook 数据的注释文本,而非实际的仇恨模因。用户如需访问这些模因,需从 Facebook Hateful Meme Challenge 网站单独下载。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
GOAT-Bench是一个包含6K多个多样化模因的数据集,专门设计用于评估大型多模态模型在识别仇恨言论、攻击性内容等社交滥用方面的能力。该数据集特别关注模型在仇恨性、厌女症、攻击性、讽刺和有害性等具体任务上的表现,并扩展评估思维链在识别模因潜在安全威胁方面的有效性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作