five

pietrolesci/stress_tests_nli

收藏
Hugging Face2022-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pietrolesci/stress_tests_nli
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来源于一个外部链接,处理过程中添加了一个新的列`label`,并对标签进行了编码映射。此外,删除了格式不正确的解析信息列,并添加了每个实例来源的文件名作为`dtype`列。数据集包含句子对(`sentence1`和`sentence2`)、标签(`label`和`gold_label`)以及数据类型(`dtype`)等信息。
提供机构:
pietrolesci
原始信息汇总

数据集概述

数据集整理

  • 新增列 label,对标签进行编码,映射如下:

    {"entailment": 0, "neutral": 1, "contradiction": 2}

  • 移除了格式不规范的解析信息列。

  • 新增列 dtype,记录每个实例来源的文件名。

数据集创建代码

  • 使用Python和Pandas库加载和处理数据。
  • 数据集特征定义包括:
    • "sentence1":字符串类型
    • "sentence2":字符串类型
    • "label":分类标签,类别包括"entailment", "neutral", "contradiction"
    • "dtype":字符串类型
    • "gold_label":字符串类型
  • 数据集被推送到Hugging Face Hub,仓库名为"pietrolesci/stress_tests_nli"。

数据集分割检查

  • 检查不同分割之间的重叠情况,结果显示所有分割之间无重叠。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作