uavster/Llama3_8b-emotion_multiclass-Plutchik
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/uavster/Llama3_8b-emotion_multiclass-Plutchik
下载链接
链接失效反馈官方服务:
资源简介:
这是一个用于文本情感分类的数据集,包含6,540个句子,每个句子都有一个主要情感标签,情感标签基于Plutchik的八种情感(喜悦、悲伤、信任、厌恶、恐惧、愤怒、惊讶、期待)加上中性类别。数据集通过Llama 3模型生成,经过多轮评分和筛选,确保情感表达的准确性。
这是一个用于文本情感分类的数据集,包含6,540个句子,每个句子都有一个主要情感标签,情感标签基于Plutchik的八种情感(喜悦、悲伤、信任、厌恶、恐惧、愤怒、惊讶、期待)加上中性类别。数据集通过Llama 3模型生成,经过多轮评分和筛选,确保情感表达的准确性。
提供机构:
uavster
原始信息汇总
数据集概述
基本信息
- 许可证: openrail
- 任务类别: 文本分类
- 语言: 英语
- 数据集名称: llama3-plutchik-multiclass
- 数据集大小: 1K<n<10K
数据描述
- 数据集用途: 文本情感分类
- 数据格式: CSV文件,包含6,540条句子
- 数据结构: 每条记录包含两个字段,分别是文本和主要情感
情感分类
- 情感类别: 基于Plutchik的八种情感类别加上中性类别,共九类
- 各类别数量:
- 喜悦: 611 (9.34%)
- 悲伤: 748 (11.44%)
- 信任: 735 (11.24%)
- 厌恶: 838 (12.81%)
- 恐惧: 579 (8.85%)
- 愤怒: 743 (11.36%)
- 惊讶: 528 (8.07%)
- 期待: 946 (14.46%)
- 中性: 812 (12.42%)
数据生成
- 生成方法: 使用4-bit量化Llama 3 8B模型生成,具体步骤包括:
- 生成约10,000条分布于所有Plutchik情感的句子
- 对每条句子进行情感评分和筛选
- 应用自动过滤和去重
- 人工检查并修正错误
引用信息
@software{Llama3-Plutchik-Multiclass, author = {Mellado Bataller, Ignacio}, title = {{Llama3-Plutchik-Multiclass}: A dataset synthesized with Llama 3 for emotion multiclass recognition}, month = {May}, year = {2024}, url = {https://huggingface.co/datasets/uavster/Llama3_8b-emotion_multiclass-Plutchik} }



