iSarcasm
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/iSarcasm
下载链接
链接失效反馈官方服务:
资源简介:
iSarcasm 是推文数据集,每条推文都标记为讽刺或非讽刺。每条讽刺推文都被进一步标记为以下类型的讽刺言论之一:
讽刺:与事态相矛盾且对收件人至关重要的推文;
具有讽刺意味的是:与事态相矛盾但对收件人没有明显批评的推文;
讽刺:看似支持收件人的推文,但包含潜在的分歧和嘲笑;
轻描淡写:推文破坏了他们所指的事态的重要性;
夸大其词:以明显夸大的方式描述事态的推文;
修辞问题:推文包含一个问题,其邀请的推论(暗示)显然与事态相矛盾。
对于每条讽刺推文,还有:
用英语句子解释为什么它是讽刺的,以及
非讽刺地传达相同含义的改写。两者均由推文的作者提供。
iSarcasm 包含 4,484 条推文,其中 777 条被标记为讽刺,3,707 条被标记为非讽刺。您会找到两个文件,isarcasm_train.csv 和 isarcasm_test.csv,每个文件分别包含随机选择的 80% 和 20% 的示例。文件中的每一行都具有 tweet_id、sarcasm_label、sarcasm_type 格式,其中 sarcasm_type 仅为讽刺性推文定义,如上所述。
提供机构:
OpenDataLab
创建时间:
2022-06-23



