five

NEUDM/acos

收藏
Hugging Face2023-05-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NEUDM/acos
下载链接
链接失效反馈
官方服务:
资源简介:
> 上述数据集为ABSA(Aspect-Based Sentiment Analysis)领域数据集,基本形式为从句子中抽取:方面术语、方面类别(术语类别)、术语在上下文中情感极性以及针对该术语的观点词,不同数据集抽取不同的信息,这点在jsonl文件的“instruction”键中有分别提到,在此我将其改造为了生成任务,需要模型按照一定格式生成抽取结果。 #### 以acos数据集中抽取的jsonl文件一条数据举例: ``` { "task_type": "generation", "dataset": "acos", "input": ["the computer has difficulty switching between tablet and computer ."], "output": "[['computer', 'laptop usability', 'negative', 'difficulty']]", "situation": "none", "label": "", "extra": "", "instruction": " Task: Extracting aspect terms and their corresponding aspect categories, sentiment polarities, and opinion words. Input: A sentence Output: A list of 4-tuples, where each tuple contains the extracted aspect term, its aspect category, sentiment polarity, and opinion words (if any). Supplement: \"Null\" means that there is no occurrence in the sentence. Example: Sentence: \"Also it's not a true SSD drive in there but eMMC, which makes a difference.\" Output: [['SSD drive', 'hard_disc operation_performance', 'negative', 'NULL']]' " } ``` > 此处未设置label和extra,在instruction中以如上所示的字符串模板,并给出一个例子进行one-shot,ABSA领域数据集(absa-quad,acos,arts,aste-data-v2,mams,semeval-2014,semeval-2015,semeval-2016,towe)每个数据集对应instruction模板相同,内容有细微不同,且部分数据集存在同一数据集不同数据instruction内容不同的情况。 #### 原始数据集 - 数据[链接](https://github.com/IsakZhang/ABSA-QUAD) - Paper: [Aspect-Category-Opinion-Sentiment Quadruple Extraction with Implicit Aspects and Opinions](https://aclanthology.org/2021.acl-long.29.pdf) - 说明:原始数据集由Restaurant-ACOS和Laptop-ACOS两个文件夹的数据组成,本次改造我将两个数据集的数据合并并区分为train、validation与test #### 当前SOTA *数据来自[论文](https://arxiv.org/abs/2305.09193)* - 评价指标:F1 score - SOTA模型:E2H-large (Restaurant-ACOS上F1 Score:**63.50** , Laptop-ACOS上F1 Score:**44.51**) - Paper:[Easy-to-Hard Learning for Information Extraction](https://arxiv.org/pdf/2305.09193.pdf) - 说明:该论文来自[Google Scholar](https://scholar.google.com/scholar?as_ylo=2023&hl=zh-CN&as_sdt=2005&sciodt=0,5&cites=5295149944344120368&scipsc=)检索到的引用ACOS原论文的论文之一,我比较了2023年的一些论文工作后筛选了一个最优指标以及模型。
提供机构:
NEUDM
原始信息汇总

数据集概述

数据集类型

  • 领域:Aspect-Based Sentiment Analysis (ABSA)
  • 任务类型:Generation

数据集内容

  • 数据结构:每条数据包含方面术语、方面类别、情感极性和观点词。
  • 输入格式:句子
  • 输出格式:4-tuple列表,每个tuple包含方面术语、方面类别、情感极性和观点词。

数据集示例

  • 输入:"the computer has difficulty switching between tablet and computer ."
  • 输出:[[computer, laptop usability, negative, difficulty]]

数据集来源

当前SOTA模型

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
NEUDM/acos是一个基于方面的情感分析(ABSA)数据集,专注于从产品评论句子中抽取方面术语、方面类别、情感极性和观点词组成的四元组。该数据集规模中等,包含约6,360条文本数据,划分为训练、验证和测试集,适用于生成式模型训练,旨在支持细粒度的情感信息提取任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作