Hamana0509/UIT-VSMEC|情感识别数据集|越南语NLP数据集
收藏数据集概述
任务类别
- 文本分类
语言
- 越南语
数据规模
- 1K<n<10K
数据集介绍
情感识别是情感分析的一种高级方法或特殊情况。在这项任务中,结果不是以极性(正面或负面)或评分形式(从1到5)呈现,而是以更详细的情感分析级别呈现,结果以悲伤、享受、愤怒、厌恶、恐惧和惊讶等更丰富的表达形式呈现。情感识别在通过识别客户评论的特定情感来衡量产品品牌价值方面起着关键作用。在本研究中,我们实现了两个目标。首先,我们构建了一个标准的越南社交媒体情感语料库(UIT-VSMEC),包含约6,927个人工标注的句子,带有六个情感标签,为越南语这一自然语言处理(NLP)中的低资源语言的情感识别研究做出了贡献。其次,我们在UIT-VSMEC上评估和测量了机器学习和深度神经网络模型。结果显示,卷积神经网络(CNN)模型以57.61%的F1分数取得了最高性能。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
FAOSTAT Forestry
FAOSTAT Forestry数据集包含了全球森林资源的相关统计数据,涵盖了森林面积、木材产量、森林管理等多个方面。该数据集提供了详细的国别数据,帮助用户了解全球森林资源的现状和变化趋势。
www.fao.org 收录
中国农村教育发展报告
该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。
www.moe.gov.cn 收录
animelist-dataset
一个基于JSON的动漫数据集,包含了最重要的元数据以及与其他多个动漫网站(如MAL、ANIDB、ANILIST、KITSU等)的交叉引用。数据集每周更新,涵盖了从10K到100K条记录的规模,主要语言为英语和日语,标签为'anime'。
huggingface 收录