five

Harvinder6766/sentiment_data_google

收藏
Hugging Face2023-11-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Harvinder6766/sentiment_data_google
下载链接
链接失效反馈
官方服务:
资源简介:
数据集sentiment_data_google用于句子级别的情感分析。该数据集使用了Google API来获取文档级别和句子级别的情感评分。数据集的标签包括NEGATIVE、POSITIVE和NEUTRAL,分别对应0、1和2。数据集分为训练集和测试集,训练集包含1166个样本,测试集包含292个样本。

The dataset sentiment_data_google is designed for sentence-level sentiment analysis. It uses the Google API to obtain document-level and sentence-level sentiment scores. The labels of the dataset include NEGATIVE, POSITIVE and NEUTRAL, which correspond to 0, 1 and 2 respectively. The dataset is split into a training set and a test set, with 1166 samples in the training set and 292 samples in the test set.
提供机构:
Harvinder6766
原始信息汇总

数据集概述

数据集名称

  • sentiment_data_google

数据集用途

  • 用于句子级别的情感分析

数据集配置

  • 默认配置
    • 训练集路径: data/train-*
    • 测试集路径: data/test-*

数据集特征

  • ID: 字符串类型
  • DOCUMENT_LEVEL_SCORE: 浮点数类型
  • DOCUMENT_LEVEL_MAGNITUDE: 浮点数类型
  • SENTENCE: 字符串类型
  • SENTENCE_SCORE: 浮点数类型
  • SENTENCE_MAGNITUDE: 浮点数类型
  • LABEL: 整数类型
  • LENGTH: 整数类型
  • index_level_0: 整数类型

数据集分割

  • 训练集
    • 字节数: 328225.8010973937
    • 样本数: 1166
  • 测试集
    • 字节数: 82197.19890260631
    • 样本数: 292

数据集大小

  • 下载大小: 172216 字节
  • 数据集大小: 410423.0 字节

标签映射

  • id2label
    • 0: "NEGATIVE"
    • 1: "POSITIVE"
    • 2: "NEUTRAL"
  • label2id
    • "NEGATIVE": 0
    • "POSITIVE": 1
    • "NEUTRAL": 2
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作