NEUDM/semeval-2015

Name: NEUDM/semeval-2015
Creator: NEUDM
Published: 2023-05-23 17:16:33
License: 暂无描述

Hugging Face2023-05-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/NEUDM/semeval-2015

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集属于ABSA（基于方面的情感分析）领域，主要包含两个主题的数据：笔记本电脑和餐厅。笔记本电脑数据集抽取的是方面类别和情感极性的二元组，而餐厅数据集抽取的是方面术语、方面类别和情感极性的三元组。数据集被改造为生成任务，模型需要按照特定格式生成抽取结果。示例展示了如何从句子中抽取方面术语、方面类别、情感极性和观点词。原始数据集来源于SemEval-2015 Task 12，当前SOTA模型在SemEval2015-Restaurant数据集上的表现由HAABSA++模型取得，准确率为81.7。

提供机构：

NEUDM

原始信息汇总

数据集概述

数据集类型

ABSA (Aspect-Based Sentiment Analysis) 数据集

数据集内容

数据集包含多个子集，如 acos, semeval-2015 等，每个子集针对不同的主题和抽取元素。
semeval-2015 数据集进一步分为 laptop 和 restaurant 两个子主题，分别抽取不同的信息：
- laptop：抽取方面类别和情感极性的二元组。
- restaurant：抽取方面术语、方面类别和情感极性的三元组。

数据集格式

数据以 JSONL 格式存储，每条数据包含以下字段：
- task_type: 任务类型，如 "generation"。
- dataset: 数据集名称。
- input: 输入句子。
- output: 抽取结果，如四元组 [方面术语, 方面类别, 情感极性, 观点词]。
- instruction: 任务说明，包括任务目标、输入输出格式及示例。

数据集示例

json { "task_type": "generation", "dataset": "acos", "input": ["the computer has difficulty switching between tablet and computer ."], "output": "[[computer, laptop usability, negative, difficulty]]", "instruction": "Task: Extracting aspect terms and their corresponding aspect categories, sentiment polarities, and opinion words. Input: A sentence Output: A list of 4-tuples, where each tuple contains the extracted aspect term, its aspect category, sentiment polarity, and opinion words (if any). Supplement: "Null" means that there is no occurrence in the sentence." }

数据集特点

每个数据集的 instruction 模板相同，但内容有细微差异，部分数据集存在同一数据集不同数据 instruction 内容不同的情况。

搜集汇总

数据集介绍

背景与挑战

背景概述

该数据集是SemEval-2015 Task 12的方面级情感分析数据集，专注于从英语句子中抽取方面类别和对应情感极性，并以二元组形式输出。数据集包含笔记本电脑主题的3,972条文本数据，用于训练和评估ABSA模型，是自然语言处理中情感分析任务的标准基准之一。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集