five

bt160607/SST-2_perturbed_aggregate

收藏
Hugging Face2024-05-30 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/bt160607/SST-2_perturbed_aggregate
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于测试和比较鲁棒性的聚合数据集。它包含了六种扰动类型(插入、删除、LCC、删除(词级别)、重复、词序),每种扰动类型有800个实例,总共有4800个实例。基础数据集来源于https://huggingface.co/datasets/stanfordnlp/sst2,扰动方法参考了https://aclanthology.org/2021.emnlp-main.117.pdf。
提供机构:
bt160607
原始信息汇总

数据集概述

基本信息

  • 许可证: CC0-1.0
  • 语言: 英语
  • 规模: 1K<n<10K

描述

  • 用途: 用于测试和比较鲁棒性
  • 数据结构: 包含六种扰动类型,分别是插入、删除、LCC、词级删除、重复和词序变化
  • 基础数据集: 来自stanfordnlp/sst2
  • 扰动方法: 参考2021.emnlp-main.117.pdf
  • 实例数量: 4800个实例,每种扰动类型800个实例
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作