Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia

Hugging Face2022-08-29 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是用于训练BERT-base基线模型，并将视觉和语言模型适应于纯文本任务的Wikipedia训练数据。数据来源于Huggingface上的wikipedia数据集的20200501.en版本。

提供机构：

原始信息汇总

数据集概述

Wikipedia train data

英文（en）

CC-BY-SA-3.0

单语种

用于训练BERT-base模型，并适应视觉与语言模型至仅文本输入任务。此用途在论文《如何将预训练的视觉与语言模型适应到仅文本输入？》中有所描述。

数据源自Huggingface上的Wikipedia数据集的"20200501.en"版本。

5,000+

优质数据集

54 个

任务类型

进入经典数据集