BERT 情感分类解释可靠性数据
收藏国家基础学科公共科学数据中心2026-03-21 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69b97a8f195d2623ac6414a7&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集旨在评估基于Bert架构的情感分类模型在SST-2数据集上的解释可靠性。数据集的构建基于“与或交互”可解释性理论,通过计算模型输出中无法由显著交互解释的分量比例(即不可解释分量ρ),来量化解释的忠实度。我们选取了在SST-2数据集上微调好的Bert-base-uncased模型,并从其测试集中随机选取了20个句子作为测试样本(覆盖正面与负面情感类别,句子长度大于20个字符)。为了确保结果的稳定性,我们进行了三组不同随机种子的独立实验。每个样本的数据均包含通过“与或交互”算法计算得到的“与”交互效用值、“或”交互效用值以及所有遮挡情况下模型对目标类别的分类置信度。通过本数据集,用户可以复现我们提出的解释可靠性指标(ρ<0.1视为通过测试),为可解释人工智能领域中自然语言处理模型的解释方法比较与评估提供了标准化的基础数据资源。
提供机构:
上海交通大学



