Primitive Shapes
收藏数据集概述
数据集目的
本数据集旨在评估机器学习算法中潜在表示的可解释性。通过提供一个简单的合成数据集,无需特定领域知识即可进行假设测试。
数据集内容
数据集包含基本的图形形状(如正方形、三角形、圆形),这些形状具有随机颜色(红、绿、蓝)和随机大小(小、中、大)。每个图像是一个白色背景上的单个随机形状。此外,通过手动编写的语法,从视觉参数、形状位置和词汇中抽样生成图像的描述。
数据集结构
数据集中的每个样本由图像和其对应的属性向量组成。属性向量编码形状和颜色,它们的组合代表目标类别 y。
引用信息
本数据集作为研究论文《Cross-Modal Conceptualization in Bottleneck Models》的一部分,在EMNLP 2023会议上发布。引用此数据集时,请使用以下BibTeX条目:
bibtex @inproceedings{ alukaev2023crossmodal, title={Cross-Modal Conceptualization in Bottleneck Models}, author={Danis Alukaev and Semen Kiselev and Ilya Pershin and Bulat Ibragimov and Vladimir V. Ivanov and Alexey Kornaev and Ivan Titov}, booktitle={The 2023 Conference on Empirical Methods in Natural Language Processing}, year={2023}, url={https://openreview.net/forum?id=ghF1EB6APx} }




