five

OATS

收藏
arXiv2024-03-07 更新2024-06-21 收录
下载链接:
https://github.com/RiTUAL-UH/OATS-ABSA
下载链接
链接失效反馈
官方服务:
资源简介:
OATS数据集是由休斯敦大学和Adobe研究机构合作开发的,专注于方面级情感分析(ABSA)。该数据集包含27,470个句子级别的四元组和17,092个评论级别的三元组,覆盖了三个新颖的领域,旨在解决现有数据集在领域限制和数据粒度方面的挑战。OATS数据集的创建过程涉及从多个来源收集数据,并通过专业的标注流程确保数据质量。该数据集适用于多种ABSA任务,如目标情感检测、方面情感三元组提取等,旨在通过提供更全面和精细的数据支持,推动ABSA领域的研究和应用。

The OATS dataset was jointly developed by the University of Houston and Adobe Research, focusing on Aspect-Based Sentiment Analysis (ABSA). This dataset contains 27,470 sentence-level quadruples and 17,092 comment-level triples, covering three novel domains, and aims to address the challenges faced by existing datasets in terms of domain limitations and data granularity. The development process of the OATS dataset involves collecting data from multiple sources and ensuring data quality through a professional annotation workflow. This dataset is applicable to a variety of ABSA tasks, such as target sentiment detection, aspect sentiment triple extraction and others, and aims to promote research and applications in the ABSA field by providing more comprehensive and fine-grained data support.
提供机构:
休斯敦大学, Adobe研究
创建时间:
2023-09-23
搜集汇总
数据集介绍
main_image_url
构建方式
OATS数据集的构建基于三个新颖的领域,包括亚马逊美食、Coursera课程和TripAdvisor酒店评论。通过从这些领域中提取的评论,数据集包含了27,470个句子级别的四元组和17,092个评论级别的元组。构建过程中,采用了Upwork平台招募的三名自由职业者进行数据标注,并使用BRAT工具进行标注。标注过程包括初始标注、交叉验证和专家审核,确保了数据的高质量和一致性。
特点
OATS数据集的主要特点在于其跨领域的多样性和高粒度情感分析能力。数据集不仅涵盖了传统的餐厅和电子产品评论,还扩展到了亚马逊美食、Coursera课程和酒店评论等新领域。此外,OATS提供了句子级别和评论级别的情感四元组,能够全面捕捉用户评论中的情感细节。
使用方法
OATS数据集适用于多种基于方面的情感分析任务,包括目标检测、方面类别识别、情感词提取和情感极性分类。研究者可以通过访问数据集的GitHub仓库获取数据,并使用提供的基线方法进行实验。数据集的多样性和高粒度标注使其成为探索和验证新情感分析算法的理想资源。
背景与挑战
背景概述
OATS数据集由休斯顿大学和Adobe Research的研究团队于2023年创建,专注于基于方面的情感分析(ABSA)。该数据集旨在解决现有ABSA数据集在领域限制和数据粒度方面的挑战,通过引入三个新的领域(亚马逊美食、Coursera课程和酒店),包含27,470个句子级四元组和17,092个评论级元组。OATS数据集的推出填补了现有数据集在处理复杂四元组提取任务和句子与评论级情感协同分析方面的空白,为ABSA领域的全面探索提供了新的资源。
当前挑战
OATS数据集面临的挑战包括:1) 解决领域问题时,现有数据集主要集中在餐厅和笔记本电脑等传统领域,缺乏对多样化领域的覆盖;2) 构建过程中,数据集需要处理复杂的四元组提取任务,确保每个四元组中的所有元素(目标实体、方面类别、情感词和情感极性)的准确关联;3) 数据集需要平衡句子级和评论级的情感分析,确保在不同层次上情感分析的准确性和一致性;4) 当前ABSA研究主要集中在英语数据上,忽视了低资源语言的挑战,如习语表达、语言结构和文化背景的差异。
常用场景
经典使用场景
OATS数据集在基于方面的情感分析(ABSA)领域中,经典的使用场景包括从用户生成的评论中提取情感四元组,即目标实体、方面类别、情感词和情感极性。这种细粒度的情感分析有助于深入理解用户对产品或服务的具体方面的情感倾向,从而为企业和研究者提供有价值的洞察。
实际应用
在实际应用中,OATS数据集可用于开发和优化情感分析模型,帮助企业实时监控和分析客户反馈,从而改进产品和服务质量。此外,该数据集还可应用于市场调研、品牌声誉管理、客户关系管理等领域,通过精准的情感分析提升决策效率和客户满意度。
衍生相关工作
基于OATS数据集,研究者们开发了多种先进的ABSA模型和方法,如目标-方面-情感联合检测(TASD)、方面情感三元组提取(ASTE)和方面情感四元组预测(ASQP)。这些工作不仅提升了情感分析的准确性和效率,还为跨领域和跨语言的情感分析研究提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作