five

muhammadravi251001/multilingual-nli-dataset

收藏
Hugging Face2023-09-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/muhammadravi251001/multilingual-nli-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: openrail --- Use it like this. ``` from datasets import load_dataset, Dataset, DatasetDict import pandas as pd data_files = {"train": "multilingual_nli_train_df.csv", "validation": "multilingual_nli_validation_df.csv", "test": "multilingual_nli_test_df.csv"} dataset = load_dataset("muhammadravi251001/multilingual-nli-dataset", data_files=data_files) selected_columns = ["premise", "hypothesis", "label"] # selected_columns = dataset.column_names['train'] # Uncomment this line to retrieve all of the columns df_train = pd.DataFrame(dataset["train"]) df_train = df_train[selected_columns] df_val = pd.DataFrame(dataset["validation"]) df_val = df_val[selected_columns] df_test = pd.DataFrame(dataset["test"]) df_test = df_test[selected_columns] train_dataset = Dataset.from_dict(df_train) validation_dataset = Dataset.from_dict(df_val) test_dataset = Dataset.from_dict(df_test) dataset = DatasetDict({"train": train_dataset, "validation": validation_dataset, "test": test_dataset}) df_multilingual_train = pd.DataFrame(dataset['train']) df_multilingual_validation = pd.DataFrame(dataset['validation']) df_multilingual_test = pd.DataFrame(dataset['test']) ```
提供机构:
muhammadravi251001
原始信息汇总

数据集概述

数据集名称

  • muhammadravi251001/multilingual-nli-dataset

数据文件

  • 训练集:multilingual_nli_train_df.csv
  • 验证集:multilingual_nli_validation_df.csv
  • 测试集:multilingual_nli_test_df.csv

数据列

  • premise
  • hypothesis
  • label

数据集加载

  • 使用 load_dataset 函数加载数据集。

数据处理

  • 将数据集转换为 Pandas DataFrame。
  • 选择特定列进行处理。
  • 将处理后的数据转换为 Dataset 对象。

数据集结构

  • 包含训练集、验证集和测试集。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作