SARC
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SARC
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为上下文调查而设计的,相关作品大量使用了所述上下文。数据集是通过抓取 Reddit 评论构建的;作者通过使用 \s 标记对讽刺条目进行自我注释,这表明网站上的讽刺意图。 Reddit 上的帖子通常是对另一条评论的回应; SARC 通过添加父评论和围绕帖子的进一步子评论来合并此信息。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
SARC是一个用于自然语言处理中讽刺检测的数据集,通过抓取Reddit评论构建,利用用户自我注释的\s标记识别讽刺意图。该数据集整合了评论的上下文信息,包括父评论和子评论,由普林斯顿大学于2018年发布。
以上内容由遇见数据集搜集并总结生成



