five

Sentimental LIAR

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Sentimental_LIAR
下载链接
链接失效反馈
官方服务:
资源简介:
我们的 Sentimental LIAR 数据集是 Kirilin 等人引入的 LIAR 扩展的修改和进一步扩展版本。在我们的数据集中,通过将半真、假、几乎不真和裤子火灾标签更改为假,将其余标签更改为真,将 LIAR 的多类标签转换为二进制注释。此外,我们将说话者姓名转换为数字 ID,以避免对姓名的文本表示产生偏见。然后通过添加使用 Google NLP API 派生的情绪来扩展二进制标签数据集。情感分析决定了文本的整体态度(即是正面还是负面),并通过数值分数进行量化。如果情感得分为正,则我们为情感属性分配正面,否则分配负面。我们还引入了进一步的扩展,通过添加使用 IBM NLP API 为每个声明提取的情绪分数,确定检测到的 6 种情绪状态的级别,即愤怒、悲伤、厌恶、恐惧和快乐。每种情绪的得分在 0 到 1 之间。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Sentimental LIAR数据集是基于LIAR数据集扩展的版本,通过将多类标签转换为二进制真/假注释,并替换说话者姓名为数字ID以减少偏见。此外,数据集引入了情感分析(正面/负面)和情绪分数(包括愤怒、悲伤等六种情绪,得分在0到1之间),以增强文本分析能力。这些扩展旨在支持虚假声明分类的深度学习模型。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作