five

SilvioLima/absa

收藏
Hugging Face2024-04-08 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/SilvioLima/absa
下载链接
链接失效反馈
官方服务:
资源简介:
absa数据集是通过合并两个数据集(DMASTE和ASTE)生成的,主要用于基于方面的情感分析。数据集包含四个主要字段:source(来源)、domain(领域)、sentence(句子)和triples(三元组)。这些字段用于训练模型,以识别新句子中的方面、意见和情感极性。数据集被分为训练集、验证集和测试集,分别包含10810、1351和1352个样本。数据集的来源包括多个领域的产品和服务评价,如电子产品、时尚、家居等。

absa数据集是通过合并两个数据集(DMASTE和ASTE)生成的,主要用于基于方面的情感分析。数据集包含四个主要字段:source(来源)、domain(领域)、sentence(句子)和triples(三元组)。这些字段用于训练模型,以识别新句子中的方面、意见和情感极性。数据集被分为训练集、验证集和测试集,分别包含10810、1351和1352个样本。数据集的来源包括多个领域的产品和服务评价,如电子产品、时尚、家居等。
提供机构:
SilvioLima
原始信息汇总

数据集概述

数据集结构

数据字段

  • source: 数据类型为字符串
  • domain: 数据类型为字符串
  • sentence: 数据类型为字符串
  • triples: 数据类型为字符串

数据分割

  • train: 包含10810个样本,总大小为3520964.114556353字节
  • test: 包含1352个样本,总大小为440364.799526382字节
  • valid: 包含1351个样本,总大小为440039.08591726486字节

数据集创建

源数据

  • 源数据集:
    • DMASTE: 包含8个领域的评价数据
    • ASTE: 包含3个子集,每个子集包含餐厅和笔记本电脑的评价数据

源语言生产者

  • 数据集由人工填写和审核
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作