five

BLA

收藏
arXiv2023-10-24 更新2024-06-21 收录
下载链接:
https://github.com/shin-ee-chen/BLA
下载链接
链接失效反馈
官方服务:
资源简介:
BLA数据集是由阿姆斯特丹大学的研究人员创建,旨在评估多模态模型处理基本语言结构的能力。该数据集包含三种语言结构:主动-被动语态、并列和关系从句,这些结构连学龄前儿童都能掌握。数据集通过自动构建,使用Visual Genome数据集中的图像和模板生成的句子。BLA数据集不仅用于评估模型,还用于提升模型处理基本语言结构的能力,特别是在零样本学习和特定任务学习场景中。

The BLA Dataset was created by researchers at the University of Amsterdam to evaluate the ability of multimodal models to process basic linguistic structures. The dataset includes three types of linguistic structures: active-passive voice, coordination, and relative clauses, all of which even preschool children can grasp. It was constructed automatically, utilizing images from the Visual Genome dataset and sentences generated from predefined templates. The BLA Dataset not only serves as an evaluation benchmark for models but also aids in improving models' capability to handle basic linguistic structures, particularly in zero-shot learning and task-specific learning scenarios.
提供机构:
阿姆斯特丹大学
创建时间:
2023-10-24
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作