five

AiresPucrs/sentiment-analysis-pt

收藏
Hugging Face2024-10-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AiresPucrs/sentiment-analysis-pt
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 dataset_info: features: - name: text dtype: string - name: label dtype: int64 splits: - name: train num_bytes: 71907240 num_examples: 85027 download_size: 43818509 dataset_size: 71907240 configs: - config_name: default data_files: - split: train path: data/train-* language: - pt pretty_name: Sentiment Analysis PT size_categories: - 10K<n<100K task_categories: - text-classification tags: - sentiment --- # Sentiment Analysis PT (Teeny-Tiny Castle) This dataset is part of a tutorial tied to the [Teeny-Tiny Castle](https://github.com/Nkluge-correa/TeenyTinyCastle), an open-source repository containing educational tools for AI Ethics and Safety research. ## How to Use ```python from datasets import load_dataset dataset = load_dataset("AiresPucrs/sentiment-analysis-pt", split = 'train') ```
提供机构:
AiresPucrs
原始信息汇总

情感分析(葡萄牙语)数据集

数据集概述

特征

  • text: 数据类型为字符串(string)
  • label: 数据类型为整数(int64)

分割

  • train: 包含71,907,240字节的数据,共85,027个样本

大小

  • 下载大小: 43,818,509字节
  • 数据集大小: 71,907,240字节

配置

  • default: 包含训练数据文件,路径为data/train-*

语言

  • 葡萄牙语(pt)

名称

  • pretty_name: sentiment-analysis-pt

大小类别

  • 10K < n < 100K

使用方法

python from datasets import load_dataset

dataset = load_dataset("AiresPucrs/sentiment-analysis-pt", split=train)

许可证

该数据集遵循Apache License 2.0。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作