SOBACO

Name: SOBACO
Creator: 东京大学
Published: 2025-09-29 16:45:50
License: 暂无描述

arXiv2025-09-29 更新2025-10-01 收录

下载链接：

https://huggingface.co/datasets/Taise228/SOBACO

下载链接

链接失效反馈

官方服务：

资源简介：

SOBACO数据集由东京大学的研究团队创建，旨在评估大型语言模型（LLMs）中的社会偏见和文化常识。数据集包含三个问题类别：年龄、性别和层级关系，涵盖了与日本社会和文化背景相关的主题。SOBACO数据集以统一的问答格式呈现，每个问题都包含背景信息、诱导性上下文和文化性上下文。数据集由手工模板创建，并通过众包方式进行验证，以确保模板的合理性。SOBACO数据集可用于评估LLMs在文化常识任务上的表现，以及去偏方法对其性能的影响。

The SOBACO dataset, developed by a research team at the University of Tokyo, is designed to evaluate social biases and cultural common sense in Large Language Models (LLMs). The dataset comprises three question categories: age, gender, and hierarchical relationships, with topics tied to Japanese society and cultural context. Formatted in a unified question-answering structure, each entry in the dataset includes background information, inductive context, and cultural context. The dataset was built using handcrafted templates and validated through crowdsourcing to ensure the logical soundness of these templates. This dataset can be used to assess the performance of LLMs on cultural common sense tasks, as well as the effect of debiasing methods on their performance.

提供机构：

东京大学

创建时间：

2025-09-29

搜集汇总

数据集介绍

构建方式

SOBACO数据集的构建过程体现了严谨的学术规范，采用手工模板创建与多阶段验证相结合的方法。研究团队首先基于日本社会文化背景筛选相关主题，涵盖年龄、性别和层级关系三大类别，通过人工撰写包含背景语境与补充语境的标准化模板。在验证阶段，邀请四位母语为日语的标注者进行文化合理性评估，采用互补问题设计与虚拟问题平衡机制确保标注质量，最终仅保留至少三位标注者一致认可的模板，有效保障了数据集的信度与效度。

特点

该数据集最显著的特征在于其统一的问题回答框架下对社交偏见与文化常识的并行评估能力。每个问题对共享相同的背景语境与问题设置，仅通过偏诱导性补充语境与文化性补充语境的切换，即可分别激活模型的偏见判断与文化常识理解。这种对称设计使得研究者能够精准观测模型在相似语境下对不同认知维度的响应差异，为探究去偏方法对文化认知的影响提供了独特的研究视角。数据集涵盖的日本特定文化场景，如敬语使用与商务礼仪等，进一步增强了其文化评估的深度与特异性。

使用方法

研究者可通过标准化提示模板将SOBACO应用于大语言模型的评估，该数据集支持基础提示与多种去偏提示的对比实验。在具体操作中，模型需根据组合语境从三个选项（两个姓名选项与未知选项）中选择答案，其中社交偏见任务的正确答案恒为未知选项，而文化常识任务的答案则依赖语境动态确定。通过分析模型在两类任务上的表现差异，特别是观察去偏方法实施后文化常识任务准确率的变化趋势，可深入探究社交偏见缓解与文化常识保持之间的内在关联，为开发兼顾公平性与实用性的语言模型提供实证依据。

背景与挑战

背景概述

SOBACO数据集由东京大学、理化学研究所和利物浦大学的研究团队于2025年共同创建，旨在评估大型语言模型中的社会偏见与文化常识理解能力。该数据集聚焦日本社会文化背景，通过统一的问答格式整合了年龄、性别和层级关系三大问题类别，填补了现有研究在非英语文化环境中评估模型偏差缓解方法对文化常识影响的空白。其创新性设计为研究语言模型在多元文化场景中的公平性与实用性提供了重要基准。

当前挑战

SOBACO数据集面临双重挑战：在领域问题层面，需解决语言模型社会偏见与文化常识之间的权衡问题，即偏差缓解方法可能显著削弱模型对文化特定知识的理解能力，例如实验中观察到最高达75%的文化常识任务性能下降；在构建过程中，需克服模板多样性有限、非二元性别议题覆盖不足，以及依赖人工验证导致的参与者多样性受限等难题，同时确保文化敏感内容的准确表达与评估有效性。

常用场景

经典使用场景

在自然语言处理领域，SOBACO数据集作为评估大型语言模型社会偏见与文化常识理解能力的基准工具，其经典应用场景体现在通过统一的问答格式对模型进行系统性评测。该数据集采用精心设计的模板结构，在相同背景语境下分别构建社会偏见与文化常识问题，使研究者能够精确测量模型在两类任务上的表现差异，为分析去偏方法对文化认知的影响提供可靠实验平台。

衍生相关工作

该数据集催生了多维度评估范式的创新研究，启发学者构建更细粒度的文化适应性基准。基于SOBACO揭示的偏见-常识权衡现象，后续研究开始探索动态去偏机制，如情境感知的提示工程和分层微调策略。这些衍生工作延续了SOBACO的核心思想，在保持偏见消除效果的同时，通过融入文化知识图谱和地域性语料来增强模型的文化认知鲁棒性。

数据集最近研究