cnut1648/mnli_resampled_as_mednli
收藏Hugging Face2023-03-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnut1648/mnli_resampled_as_mednli
下载链接
链接失效反馈官方服务:
资源简介:
---
tags:
- nli
---
# Dataset Card for Dataset Name
This dataset inherits from [mnli](https://huggingface.co/datasets/glue/viewer/mnli/train), and the only changes is to downsample to the same size as mednli. It is created via
```python
with open("/path/to/mednli/mli_train_v1.jsonl") as f:
data = [json.loads(line) for line in f.readlines()]
raw_datasets = load_dataset("glue", "mnli")
raw_datasets["train"] = raw_datasets["train"].shuffle(seed=42).select(range(len(data)))
raw_datasets.push_to_hub("cnut1648/mnli_resampled_as_mednli")
```
提供机构:
cnut1648
原始信息汇总
数据集概述
数据集名称
- 名称: mnli_resampled_as_mednli
数据集来源
- 原始数据集: mnli
- 修改方式: 通过从原始mnli数据集中随机抽样,使其大小与mednli相同。
数据集处理
- 处理步骤:
- 读取mednli的训练数据集
mli_train_v1.jsonl。 - 加载mnli数据集。
- 对mnli数据集的训练部分进行随机洗牌,并选择与mednli数据集相同大小的样本。
- 将处理后的数据集推送到Hugging Face Hub。
- 读取mednli的训练数据集
数据集存储
- 存储位置: Hugging Face Hub,仓库名为
cnut1648/mnli_resampled_as_mednli
数据集标签
- 标签: nli



