muhammadravi251001/multilingual-nli-dataset
收藏Hugging Face2023-09-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/muhammadravi251001/multilingual-nli-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
license: openrail
---
Use it like this.
```
from datasets import load_dataset, Dataset, DatasetDict
import pandas as pd
data_files = {"train": "multilingual_nli_train_df.csv",
"validation": "multilingual_nli_validation_df.csv",
"test": "multilingual_nli_test_df.csv"}
dataset = load_dataset("muhammadravi251001/multilingual-nli-dataset", data_files=data_files)
selected_columns = ["premise", "hypothesis", "label"]
# selected_columns = dataset.column_names['train'] # Uncomment this line to retrieve all of the columns
df_train = pd.DataFrame(dataset["train"])
df_train = df_train[selected_columns]
df_val = pd.DataFrame(dataset["validation"])
df_val = df_val[selected_columns]
df_test = pd.DataFrame(dataset["test"])
df_test = df_test[selected_columns]
train_dataset = Dataset.from_dict(df_train)
validation_dataset = Dataset.from_dict(df_val)
test_dataset = Dataset.from_dict(df_test)
dataset = DatasetDict({"train": train_dataset, "validation": validation_dataset, "test": test_dataset})
df_multilingual_train = pd.DataFrame(dataset['train'])
df_multilingual_validation = pd.DataFrame(dataset['validation'])
df_multilingual_test = pd.DataFrame(dataset['test'])
```
提供机构:
muhammadravi251001
原始信息汇总
数据集概述
数据集名称
muhammadravi251001/multilingual-nli-dataset
数据文件
- 训练集:
multilingual_nli_train_df.csv - 验证集:
multilingual_nli_validation_df.csv - 测试集:
multilingual_nli_test_df.csv
数据列
premisehypothesislabel
数据集加载
- 使用
load_dataset函数加载数据集。
数据处理
- 将数据集转换为 Pandas DataFrame。
- 选择特定列进行处理。
- 将处理后的数据转换为
Dataset对象。
数据集结构
- 包含训练集、验证集和测试集。



