five

DaniFrame/MNLIPerturbed

收藏
Hugging Face2023-06-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DaniFrame/MNLIPerturbed
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: premise dtype: string - name: hypothesis dtype: string - name: label dtype: class_label: names: '0': entailment '1': neutral '2': contradiction - name: idx dtype: int32 splits: - name: mnli_perturbed_keyboard_0.01 num_bytes: 1847243 num_examples: 9796 - name: mnli_perturbed_keyboard_0.05 num_bytes: 1847707 num_examples: 9796 - name: mnli_perturbed_keyboard_0.1 num_bytes: 1848464 num_examples: 9796 - name: mnli_perturbed_ocr_0.01 num_bytes: 1847030 num_examples: 9796 - name: mnli_perturbed_ocr_0.05 num_bytes: 1847037 num_examples: 9796 - name: mnli_perturbed_ocr_0.1 num_bytes: 1847077 num_examples: 9796 - name: mnli_perturbed_spellingerror_0.01 num_bytes: 1851630 num_examples: 9796 - name: mnli_perturbed_spellingerror_0.05 num_bytes: 1862559 num_examples: 9796 - name: mnli_perturbed_spellingerror_0.1 num_bytes: 1878344 num_examples: 9796 - name: mnli_perturbed_typos_0.01 num_bytes: 1847578 num_examples: 9796 - name: mnli_perturbed_typos_0.05 num_bytes: 1848413 num_examples: 9796 - name: mnli_perturbed_typos_0.1 num_bytes: 1850051 num_examples: 9796 - name: mnli_perturbed_sne_0.1 num_bytes: 1872957 num_examples: 9796 - name: mnli_perturbed_sne_0.2 num_bytes: 1873160 num_examples: 9796 - name: mnli_perturbed_sne_0.3 num_bytes: 1873342 num_examples: 9796 - name: mnli_perturbed_sswn_0.1 num_bytes: 1870155 num_examples: 9796 - name: mnli_perturbed_sswn_0.2 num_bytes: 1889877 num_examples: 9796 - name: mnli_perturbed_sswn_0.3 num_bytes: 1912977 num_examples: 9796 - name: mnli_perturbed_contraction num_bytes: 1848650 num_examples: 9796 - name: mnli_perturbed_insertadv num_bytes: 2311876 num_examples: 9796 - name: mnli_perturbed_prejudice num_bytes: 1848995 num_examples: 9796 - name: mnli_perturbed_punctuation num_bytes: 1949675 num_examples: 9796 - name: mnli_perturbed_reverseneg num_bytes: 1932325 num_examples: 9796 - name: mnli_perturbed_swapnum num_bytes: 1847945 num_examples: 9796 - name: mnli_perturbed_verbtense num_bytes: 1858466 num_examples: 9796 - name: mnli_perturbed_twitter num_bytes: 2115507 num_examples: 9796 - name: mnli_perturbed_wordcase num_bytes: 1848654 num_examples: 9796 download_size: 36140138 dataset_size: 51077694 --- # Dataset Card for "MNLIPerturbed" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
DaniFrame
原始信息汇总

数据集概述

特征信息

  • premise: 数据类型为字符串。
  • hypothesis: 数据类型为字符串。
  • label: 数据类型为分类标签,包含以下类别:
    • 0: entailment
    • 1: neutral
    • 2: contradiction
  • idx: 数据类型为32位整数。

数据分割

数据集包含多个分割,每个分割的名称、字节数和样本数如下:

  • mnli_perturbed_keyboard_0.01: 1847243字节, 9796样本
  • mnli_perturbed_keyboard_0.05: 1847707字节, 9796样本
  • mnli_perturbed_keyboard_0.1: 1848464字节, 9796样本
  • mnli_perturbed_ocr_0.01: 1847030字节, 9796样本
  • mnli_perturbed_ocr_0.05: 1847037字节, 9796样本
  • mnli_perturbed_ocr_0.1: 1847077字节, 9796样本
  • mnli_perturbed_spellingerror_0.01: 1851630字节, 9796样本
  • mnli_perturbed_spellingerror_0.05: 1862559字节, 9796样本
  • mnli_perturbed_spellingerror_0.1: 1878344字节, 9796样本
  • mnli_perturbed_typos_0.01: 1847578字节, 9796样本
  • mnli_perturbed_typos_0.05: 1848413字节, 9796样本
  • mnli_perturbed_typos_0.1: 1850051字节, 9796样本
  • mnli_perturbed_sne_0.1: 1872957字节, 9796样本
  • mnli_perturbed_sne_0.2: 1873160字节, 9796样本
  • mnli_perturbed_sne_0.3: 1873342字节, 9796样本
  • mnli_perturbed_sswn_0.1: 1870155字节, 9796样本
  • mnli_perturbed_sswn_0.2: 1889877字节, 9796样本
  • mnli_perturbed_sswn_0.3: 1912977字节, 9796样本
  • mnli_perturbed_contraction: 1848650字节, 9796样本
  • mnli_perturbed_insertadv: 2311876字节, 9796样本
  • mnli_perturbed_prejudice: 1848995字节, 9796样本
  • mnli_perturbed_punctuation: 1949675字节, 9796样本
  • mnli_perturbed_reverseneg: 1932325字节, 9796样本
  • mnli_perturbed_swapnum: 1847945字节, 9796样本
  • mnli_perturbed_verbtense: 1858466字节, 9796样本
  • mnli_perturbed_twitter: 2115507字节, 9796样本
  • mnli_perturbed_wordcase: 1848654字节, 9796样本

数据集大小

  • 下载大小: 36140138字节
  • 数据集大小: 51077694字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作