pythainlp/wisesight_sentiment_prompt
收藏Hugging Face2023-12-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pythainlp/wisesight_sentiment_prompt
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- th
license: cc0-1.0
size_categories:
- 10K<n<100K
task_categories:
- text-generation
- text2text-generation
pretty_name: i
dataset_info:
features:
- name: inputs
dtype: string
- name: targets
dtype: string
splits:
- name: train
num_bytes: 10132750
num_examples: 16194
- name: validation
num_bytes: 1118295
num_examples: 1777
- name: test
num_bytes: 1240521
num_examples: 1965
download_size: 3093175
dataset_size: 12491566
tags:
- instruct-fellow
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
wisesight_sentiment_prompt is the instruct fellow dataset for sentiment Thai text by prompt. It can use fine-tuning model.
- inputs: Prompt
- targets: Text targets that AI should answer.
**Template**
```
Inputs: จำแนกประโยคต่อไปนี้เป็นคำถามหรือข้อความเชิงบวก/เป็นกลาง/เชิงลบ:\n{text}
targets: ประโยคที่กำหนดสามารถจำแนกข้อความได้เป็นข้อความ{category}
```
category
- คำถาม: question
- เชิงบวก: positive
- เป็นกลาง: neutral
- เชิงลบ: negative
Notebook that used create this dataset: [https://github.com/PyThaiNLP/support-aya-datasets/blob/main/sentiment-analysis/wisesight_sentiment.ipynb](https://github.com/PyThaiNLP/support-aya-datasets/blob/main/sentiment-analysis/wisesight_sentiment.ipynb)
Wisesight Sentiment Corpus: Social media messages in Thai language with sentiment category (positive, neutral, negative, question)
* Released to public domain under Creative Commons Zero v1.0 Universal license.
* Size: 26,737 messages
* Language: Central Thai
* Style: Informal and conversational. With some news headlines and advertisement.
* Time period: Around 2016 to early 2019. With small amount from other period.
* Domains: Mixed. Majority are consumer products and services (restaurants, cosmetics, drinks, car, hotels), with some current affairs.
See more: [wisesight_sentiment](https://huggingface.co/datasets/wisesight_sentiment).
PyThaiNLP
提供机构:
pythainlp
原始信息汇总
数据集概述
基本信息
- 语言: 泰语
- 许可: CC0-1.0
- 数据规模: 10K<n<100K
- 任务类别: 文本生成、文本到文本生成
- 友好名称: i
数据集特征
- 输入: 字符串类型
- 目标: 字符串类型
数据集划分
- 训练集: 16194个样本,10132750字节
- 验证集: 1777个样本,1118295字节
- 测试集: 1965个样本,1240521字节
数据集大小
- 下载大小: 3093175字节
- 数据集大小: 12491566字节
标签
- 标签: instruct-fellow
配置
- 配置名称: default
- 数据文件路径:
- 训练集: data/train-*
- 验证集: data/validation-*
- 测试集: data/test-*
描述
- 输入: 提示
- 目标: AI应回答的文本目标
模板
- 输入模板: จำแนกประโยคต่อไปนี้เป็นคำถามหรือข้อความเชิงบวก/เป็นกลาง/เชิงลบ: {text}
- 目标模板: ประโยคที่กำหนดสามารถจำแนกข้อความได้เป็นข้อความ{category}
类别
- คำถาม: question
- เชิงบวก: positive
- เป็นกลาง: neutral
- เชิงลบ: negative
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



