Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia
收藏Hugging Face2022-08-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于训练BERT-base基线模型,并将视觉和语言模型适应于纯文本任务的Wikipedia训练数据。数据来源于Huggingface上的wikipedia数据集的20200501.en版本。
提供机构:
Lo
原始信息汇总
数据集概述
数据集名称
Wikipedia train data
语言
英文(en)
许可证
CC-BY-SA-3.0
多语言性
单语种
用途
用于训练BERT-base模型,并适应视觉与语言模型至仅文本输入任务。此用途在论文《如何将预训练的视觉与语言模型适应到仅文本输入?》中有所描述。
数据来源
数据源自Huggingface上的Wikipedia数据集的"20200501.en"版本。



