SENTIBENCH

Name: SENTIBENCH
Creator: 哈尔滨工业大学（深圳）
Published: 2025-03-05 14:45:25
License: 暂无描述

arXiv2025-03-05 更新2025-03-07 收录

下载链接：

http://arxiv.org/abs/2503.03225v1

下载链接

链接失效反馈

官方服务：

资源简介：

SENTIBENCH是一个综合性的情感分析基准，由哈尔滨工业大学（深圳）的研究团队开发。该数据集包含3个典型类别：基本情感分析、多方面情感分析和细粒度情感分析，覆盖了12个代表性任务及其对应的数据集。它旨在系统地评估LLM在情感分析方面的能力，涵盖从文档到句子级别的情感分类，以及更复杂的情感状态识别和细粒度情感元素分析等任务。

SENTIBENCH is a comprehensive sentiment analysis benchmark developed by the research team from Harbin Institute of Technology (Shenzhen). This dataset encompasses three typical categories: basic sentiment analysis, aspect-based sentiment analysis, and fine-grained sentiment analysis, covering 12 representative tasks and their corresponding datasets. It aims to systematically evaluate the sentiment analysis capabilities of LLMs, covering tasks ranging from document-level and sentence-level sentiment classification to more complex ones such as emotion state recognition and fine-grained sentiment element analysis.

提供机构：

哈尔滨工业大学（深圳）

创建时间：

2025-03-05

搜集汇总

数据集介绍

构建方式

SENTIBENCH数据集的构建方式是通过从高级大型语言模型（LLMs）中进行有针对性的蒸馏，以实现紧凑的模型，同时保持强大的情感分析能力。该方法将蒸馏目标分解为两个关键组件：情感相关知识和技术对齐。为了转移这些组件，论文提出了一个两阶段的蒸馏框架。第一阶段是知识驱动蒸馏（KNOWDIST），用于将情感相关知识转移到学生模型中，以增强基本的情感分析能力。第二阶段是上下文学习蒸馏（ICLDIST），用于将特定任务的提示跟随能力转移到学生模型中，以优化技术对齐。在评估阶段，作者引入了SENTIBENCH，这是一个全面的情感分析基准，包含12个数据集的3个任务类别。实验结果表明，该模型有效地平衡了模型大小和性能，与现有的小型LLMs相比具有强大的竞争力。

特点

SENTIBENCH数据集的特点在于它是一个全面的情感分析基准，包含12个数据集的3个任务类别。这些任务类别包括基本情感分析、多面情感分析和细粒度情感分析。该数据集的构建旨在评估LLMs的情感分析能力，并促进情感分析领域的研究。此外，该数据集的构建还采用了两阶段的蒸馏框架，即知识驱动蒸馏（KNOWDIST）和上下文学习蒸馏（ICLDIST），以有效地将高级LLMs的情感分析能力转移到小型模型中。这些特点使得SENTIBENCH数据集成为一个有价值的工具，可以促进情感分析领域的研究。

使用方法

使用SENTIBENCH数据集的方法是通过两阶段的蒸馏框架来训练学生模型。首先，使用知识驱动蒸馏（KNOWDIST）将情感相关知识从教师LLM转移到学生模型中，以提高其基本的情感分析能力。其次，使用上下文学习蒸馏（ICLDIST）将特定任务的提示跟随能力转移到学生模型中，以优化其技术对齐。在蒸馏过程中，需要收集大量多样化的用户文本，并构建各种分析和重写提示。然后，将这些提示应用于教师LLM，以解释现有文本中的情感，并积极探索和生成多样的情感表达模式。最后，利用这些数据集来优化学生模型，以提高其在情感分析任务中的性能。通过这种方式，可以有效地利用SENTIBENCH数据集来训练和评估情感分析模型。

背景与挑战

背景概述

SENTIBENCH数据集是为了评估大型语言模型（LLMs）在情感分析任务上的能力而开发的，它由哈尔滨工业大学深圳分校、鹏城实验室和广东省新型安全智能技术重点实验室的研究人员共同创建。该数据集旨在解决情感分析领域中的挑战，特别是如何有效地从大型语言模型中提取情感分析能力，并将其转移到小型模型中，从而降低计算成本。SENTIBENCH数据集包含了12个数据集，跨越了基本的情感分析、多方面的情感分析和细粒度的情感分析三个任务类别，为情感分析任务提供了一个全面的基准。

当前挑战

SENTIBENCH数据集的创建面临了几个挑战。首先，如何有效地从大型语言模型中提取情感分析能力是一个难题。其次，如何将提取的知识有效地转移到小型模型中也是一个挑战。此外，如何确保小型模型在未见过的任务上也能表现出色也是一个挑战。为了解决这些挑战，研究人员提出了一个两阶段的蒸馏框架，包括知识驱动蒸馏（KNOWDIST）和上下文学习蒸馏（ICLDIST）。KNOWDIST旨在转移基本的情感分析能力，而ICLDIST则专注于转移任务特定的提示跟随能力，以优化任务对齐。通过这些方法，研究人员能够有效地从大型语言模型中提取情感分析能力，并将其转移到小型模型中，从而提高情感分析任务的性能。

常用场景

经典使用场景

SENTIBENCH数据集广泛应用于情感分析领域，尤其是通过目标蒸馏技术从大型语言模型（LLMs）中提取情感分析能力。该数据集包含了12个数据集，涵盖了基本的情感分析、多方面的情感分析和细粒度的情感分析三个任务类别。研究者可以利用SENTIBENCH数据集评估和比较不同情感分析模型的性能，从而推动情感分析技术的发展和应用。

解决学术问题

SENTIBENCH数据集解决了情感分析领域的一个关键问题：如何有效地从大型语言模型中提取情感分析能力。通过目标蒸馏技术，研究者可以将LLMs中的情感相关知识和任务对齐能力转移到更小、更高效的模型中，从而降低计算成本并提高情感分析任务的性能。SENTIBENCH数据集的引入为情感分析领域的学术研究提供了重要的基准和工具。

衍生相关工作

SENTIBENCH数据集衍生了许多相关的经典工作。例如，研究者可以利用SENTIBENCH数据集评估和比较不同目标蒸馏方法的性能，从而推动目标蒸馏技术的发展。此外，SENTIBENCH数据集还可以用于开发新的情感分析模型，并将其应用于实际场景中，例如社交媒体情感分析、产品评论分析、客户服务等等。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集