five

Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia

收藏
Hugging Face2022-08-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Lo/adapt-pre-trained-VL-models-to-text-data-Wikipedia
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于训练BERT-base基线模型,并将视觉和语言模型适应于纯文本任务的Wikipedia训练数据。数据来源于Huggingface上的wikipedia数据集的20200501.en版本。
提供机构:
Lo
原始信息汇总

数据集概述

数据集名称

Wikipedia train data

语言

英文(en)

许可证

CC-BY-SA-3.0

多语言性

单语种

用途

用于训练BERT-base模型,并适应视觉与语言模型至仅文本输入任务。此用途在论文《如何将预训练的视觉与语言模型适应到仅文本输入?》中有所描述。

数据来源

数据源自Huggingface上的Wikipedia数据集的"20200501.en"版本。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作