five

persiannlp/parsinlu_sentiment

收藏
Hugging Face2022-10-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/persiannlp/parsinlu_sentiment
下载链接
链接失效反馈
官方服务:
资源简介:
PersiNLU是一个用于波斯语情感分析的数据集。该数据集由专家生成,语言为波斯语(fa),许可证为CC BY-NC-SA 4.0。数据集规模在1K到10K之间,属于单语数据集。数据集的来源包括扩展、翻译和MNLI数据集。数据集的结构部分提供了一个数据实例,展示了数据字段及其含义,包括评论文本、评论ID、问题、类别、方面和情感标签等。
提供机构:
persiannlp
原始信息汇总

数据集概述

数据集名称

  • 名称: PersiNLU (Sentiment Analysis)

数据集描述

数据集摘要

  • 摘要: 一个波斯语的情感分析数据集。

支持的任务和排行榜

  • 任务: 情感分析
  • 排行榜: 信息缺失

语言

  • 语言: 波斯语 (fa)

数据集结构

数据实例

  • 示例: json { "review": "خوب بود ولی خیلی گرون شده دیگه...فک نکنم به این قیمت ارزش خرید داشته باشد", "review_id": "1538", "example_id": "4", "excel_id": "food_194", "question": "نظر شما در مورد بسته بندی و نگهداری این حلوا شکری، ارده و کنجد چیست؟", "category": "حلوا شکری، ارده و کنجد", "aspect": "بسته بندی", "label": "-3", "guid": "food-dev-r1538-e4" }

数据字段

  • 字段:
    • review: 评论文本。

    • review_id: 评论的唯一ID。

    • example_id: 特定属性评论的唯一ID。

    • question: 关于特定属性的自然语言问题。

    • category: 评论中讨论的主题。

    • aspect: 输入问题中提到的方面。

    • label: 对特定主题在提及方面的总体情感。标签定义如下:

      -3: no sentiment expressed, -2: very negative, -1: negative, 0: neutral, 1: positive, 2: very positive, 3: mixed,

数据集创建

许可证信息

  • 许可证: CC BY-NC-SA 4.0

引用信息

bibtex @article{huggingface:dataset, title = {ParsiNLU: A Suite of Language Understanding Challenges for Persian}, authors = {Khashabi, Daniel and Cohan, Arman and Shakeri, Siamak and Hosseini, Pedram and Pezeshkpour, Pouya and Alikhani, Malihe and Aminnaseri, Moin and Bitaab, Marzieh and Brahman, Faeze and Ghazarian, Sarik and others}, year={2020}, journal = {arXiv e-prints}, eprint = {2012.06154}, }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作