five

SARC

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/SARC
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为上下文调查而设计的,相关作品大量使用了所述上下文。数据集是通过抓取 Reddit 评论构建的;作者通过使用 \s 标记对讽刺条目进行自我注释,这表明网站上的讽刺意图。 Reddit 上的帖子通常是对另一条评论的回应; SARC 通过添加父评论和围绕帖子的进一步子评论来合并此信息。
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SARC是一个用于自然语言处理中讽刺检测的数据集,通过抓取Reddit评论构建,利用用户自我注释的\s标记识别讽刺意图。该数据集整合了评论的上下文信息,包括父评论和子评论,由普林斯顿大学于2018年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作