muhammadravi251001/multilingual-nli-dataset

Name: muhammadravi251001/multilingual-nli-dataset
Creator: muhammadravi251001
Published: 2023-09-11 07:58:14
License: 暂无描述

Hugging Face2023-09-11 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/muhammadravi251001/multilingual-nli-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: openrail --- Use it like this. ``` from datasets import load_dataset, Dataset, DatasetDict import pandas as pd data_files = {"train": "multilingual_nli_train_df.csv", "validation": "multilingual_nli_validation_df.csv", "test": "multilingual_nli_test_df.csv"} dataset = load_dataset("muhammadravi251001/multilingual-nli-dataset", data_files=data_files) selected_columns = ["premise", "hypothesis", "label"] # selected_columns = dataset.column_names['train'] # Uncomment this line to retrieve all of the columns df_train = pd.DataFrame(dataset["train"]) df_train = df_train[selected_columns] df_val = pd.DataFrame(dataset["validation"]) df_val = df_val[selected_columns] df_test = pd.DataFrame(dataset["test"]) df_test = df_test[selected_columns] train_dataset = Dataset.from_dict(df_train) validation_dataset = Dataset.from_dict(df_val) test_dataset = Dataset.from_dict(df_test) dataset = DatasetDict({"train": train_dataset, "validation": validation_dataset, "test": test_dataset}) df_multilingual_train = pd.DataFrame(dataset['train']) df_multilingual_validation = pd.DataFrame(dataset['validation']) df_multilingual_test = pd.DataFrame(dataset['test']) ```

提供机构：

muhammadravi251001

原始信息汇总

数据集概述

数据集名称

muhammadravi251001/multilingual-nli-dataset

数据文件

训练集：multilingual_nli_train_df.csv
验证集：multilingual_nli_validation_df.csv
测试集：multilingual_nli_test_df.csv

数据列

premise
hypothesis
label

数据集加载

使用 load_dataset 函数加载数据集。

数据处理

将数据集转换为 Pandas DataFrame。
选择特定列进行处理。
将处理后的数据转换为 Dataset 对象。

数据集结构

包含训练集、验证集和测试集。

5,000+

优质数据集

54 个

任务类型

进入经典数据集