fittar/visually_grounded_embeddings

Name: fittar/visually_grounded_embeddings
Creator: fittar
Published: 2023-10-23 14:50:10
License: 暂无描述

Hugging Face2023-10-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/fittar/visually_grounded_embeddings

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多种视觉基础词嵌入模型，这些模型通过从图像中提取的视觉信息进行了有效增强。在各种词语相似性和相关性基准测试中，这些嵌入模型与人类判断的相关性比纯文本嵌入更强。数据集提供了四种可用的嵌入文件，其中两种来自论文《Learning Zero-Shot Multifaceted Visually Grounded Word Embeddings via Multi-Task Training》，另外两种来自论文《Language with Vision: a Study on Grounded Word and Sentence Embeddings》。所有嵌入文件都包含1024维的词向量，除了v_glove_300_d_2.0，它包含300维的词向量。

提供机构：

fittar

原始信息汇总

Visually Grounded embeddings for Fast-text and GloVe

该仓库包含多个基于视觉的词嵌入模型。这些嵌入模型有效地融入了来自图像的视觉信息，已被证明在各种词相似性和相关性基准测试中，与文本嵌入相比，能显示出更强的人类判断相关性。

使用方法

所有模型均采用 gensim 格式编码。加载模型的示例如下：

python import gensim

model_g = gensim.models.KeyedVectors.load_word2vec_format(path_to_embeddings, binary=True)

检索最相似的词

print(model_g.most_similar(together, topn=10))

[(togther, 0.6425853967666626), (togehter, 0.6374243497848511), (togeather, 0.6196791529655457), (togather, 0.5998020172119141), (togheter, 0.5819681882858276), (toghether, 0.5738174319267273), (2gether, 0.5187329053878784), (togethor, 0.501663088798523), (gether, 0.49128714203834534), (toegther, 0.48457157611846924)]

print(model_g.most_similar(sad, topn=10))

[(saddening, 0.6763913631439209), (depressing, 0.6676110029220581), (saddened, 0.6352651715278625), (sorrowful, 0.6336953043937683), (heartbreaking, 0.6180269122123718), (heartbroken, 0.6099187135696411), (tragic, 0.6039361953735352), (pathetic, 0.5848405361175537), (Sad, 0.5826965570449829), (mournful, 0.5742306709289551)]

查找异常词

print(model_g.doesnt_match([fire, water, land, sea, air, car]))

car

可用的嵌入模型

在 Files and Versions 标签下，您可以看到以下4个可用的嵌入模型：

来自论文 Learning Zero-Shot Multifaceted Visually Grounded Word Embeddings via Multi-Task Training 的嵌入模型：
- v_glove_1024d_1.0
- v_fasttext_1024d_1.0
来自论文 Language with Vision: a Study on Grounded Word and Sentence Embeddings 的嵌入模型：
- v_glove_1024d_2.0
- v_glove_300_d_2.0

所有模型均包含1024维的词向量，除了 v_glove_300_d_2.0 包含300维的词向量。

5,000+

优质数据集

54 个

任务类型

进入经典数据集