pietrolesci/stress_tests_nli
收藏Hugging Face2022-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pietrolesci/stress_tests_nli
下载链接
链接失效反馈官方服务:
资源简介:
该数据集来源于一个外部链接,处理过程中添加了一个新的列`label`,并对标签进行了编码映射。此外,删除了格式不正确的解析信息列,并添加了每个实例来源的文件名作为`dtype`列。数据集包含句子对(`sentence1`和`sentence2`)、标签(`label`和`gold_label`)以及数据类型(`dtype`)等信息。
提供机构:
pietrolesci
原始信息汇总
数据集概述
- 原始数据集页面链接:https://abhilasharavichander.github.io/NLI_StressTest/
- 数据集下载链接:https://drive.google.com/open?id=1faGA5pHdu5Co8rFhnXn-6jbBYC2R1dhw
数据集整理
-
新增列
label,对标签进行编码,映射如下:{"entailment": 0, "neutral": 1, "contradiction": 2}
-
移除了格式不规范的解析信息列。
-
新增列
dtype,记录每个实例来源的文件名。
数据集创建代码
- 使用Python和Pandas库加载和处理数据。
- 数据集特征定义包括:
- "sentence1":字符串类型
- "sentence2":字符串类型
- "label":分类标签,类别包括"entailment", "neutral", "contradiction"
- "dtype":字符串类型
- "gold_label":字符串类型
- 数据集被推送到Hugging Face Hub,仓库名为"pietrolesci/stress_tests_nli"。
数据集分割检查
- 检查不同分割之间的重叠情况,结果显示所有分割之间无重叠。



