BERT 情感分类表征瓶颈数据
收藏国家基础学科公共科学数据中心2026-03-21 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69b97a94195d2623ac6414ad&type=1
下载链接
链接失效反馈官方服务:
资源简介:
本数据集旨在评估基于Bert架构的语法判断模型在CoLA数据集上的表征瓶颈。数据集的构建基于“多阶双变元交互”可解释性理论,通过衡量中阶双变元交互强度和极低阶双变元交互强度的比例,以及中阶双变元交互强度和极高阶双变元交互强度的比例,来量化模型表征瓶颈的程度。我们选取了在CoLA数据集上微调好的Bert-base-uncased模型,并从其测试集中随机选取了20个句子作为测试样本(覆盖可接受和不可接受类别,句子长度大于20个字符)。为了确保结果的稳定性,我们进行了三组不同随机种子的独立实验。每个样本的数据均包含通过“多阶双变元交互”算法计算得到的各阶双变元交互的效用值。通过本数据集,用户可以复现我们提出的交互复杂度瓶颈指标(p_1<1且p_2<1视为通过测试),为可解释人工智能领域中文本分类模型的表征瓶颈评估提供了标准化的基础数据资源。
提供机构:
上海交通大学



