persiannlp/parsinlu_sentiment
收藏Hugging Face2022-10-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/persiannlp/parsinlu_sentiment
下载链接
链接失效反馈官方服务:
资源简介:
PersiNLU是一个用于波斯语情感分析的数据集。该数据集由专家生成,语言为波斯语(fa),许可证为CC BY-NC-SA 4.0。数据集规模在1K到10K之间,属于单语数据集。数据集的来源包括扩展、翻译和MNLI数据集。数据集的结构部分提供了一个数据实例,展示了数据字段及其含义,包括评论文本、评论ID、问题、类别、方面和情感标签等。
提供机构:
persiannlp
原始信息汇总
数据集概述
数据集名称
- 名称: PersiNLU (Sentiment Analysis)
数据集描述
数据集摘要
- 摘要: 一个波斯语的情感分析数据集。
支持的任务和排行榜
- 任务: 情感分析
- 排行榜: 信息缺失
语言
- 语言: 波斯语 (
fa)
数据集结构
数据实例
- 示例: json { "review": "خوب بود ولی خیلی گرون شده دیگه...فک نکنم به این قیمت ارزش خرید داشته باشد", "review_id": "1538", "example_id": "4", "excel_id": "food_194", "question": "نظر شما در مورد بسته بندی و نگهداری این حلوا شکری، ارده و کنجد چیست؟", "category": "حلوا شکری، ارده و کنجد", "aspect": "بسته بندی", "label": "-3", "guid": "food-dev-r1538-e4" }
数据字段
- 字段:
-
review: 评论文本。 -
review_id: 评论的唯一ID。 -
example_id: 特定属性评论的唯一ID。 -
question: 关于特定属性的自然语言问题。 -
category: 评论中讨论的主题。 -
aspect: 输入问题中提到的方面。 -
label: 对特定主题在提及方面的总体情感。标签定义如下:-3: no sentiment expressed, -2: very negative, -1: negative, 0: neutral, 1: positive, 2: very positive, 3: mixed,
-
数据集创建
许可证信息
- 许可证: CC BY-NC-SA 4.0
引用信息
bibtex @article{huggingface:dataset, title = {ParsiNLU: A Suite of Language Understanding Challenges for Persian}, authors = {Khashabi, Daniel and Cohan, Arman and Shakeri, Siamak and Hosseini, Pedram and Pezeshkpour, Pouya and Alikhani, Malihe and Aminnaseri, Moin and Bitaab, Marzieh and Brahman, Faeze and Ghazarian, Sarik and others}, year={2020}, journal = {arXiv e-prints}, eprint = {2012.06154}, }



