five

fittar/visually_grounded_embeddings

收藏
Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fittar/visually_grounded_embeddings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多种视觉基础词嵌入模型,这些模型通过从图像中提取的视觉信息进行了有效增强。在各种词语相似性和相关性基准测试中,这些嵌入模型与人类判断的相关性比纯文本嵌入更强。数据集提供了四种可用的嵌入文件,其中两种来自论文《Learning Zero-Shot Multifaceted Visually Grounded Word Embeddings via Multi-Task Training》,另外两种来自论文《Language with Vision: a Study on Grounded Word and Sentence Embeddings》。所有嵌入文件都包含1024维的词向量,除了v_glove_300_d_2.0,它包含300维的词向量。
提供机构:
fittar
原始信息汇总

Visually Grounded embeddings for Fast-text and GloVe

该仓库包含多个基于视觉的词嵌入模型。这些嵌入模型有效地融入了来自图像的视觉信息,已被证明在各种词相似性和相关性基准测试中,与文本嵌入相比,能显示出更强的人类判断相关性。

使用方法

所有模型均采用 gensim 格式编码。加载模型的示例如下:

python import gensim

model_g = gensim.models.KeyedVectors.load_word2vec_format(path_to_embeddings, binary=True)

检索最相似的词

print(model_g.most_similar(together, topn=10))

[(togther, 0.6425853967666626), (togehter, 0.6374243497848511), (togeather, 0.6196791529655457), (togather, 0.5998020172119141), (togheter, 0.5819681882858276), (toghether, 0.5738174319267273), (2gether, 0.5187329053878784), (togethor, 0.501663088798523), (gether, 0.49128714203834534), (toegther, 0.48457157611846924)]

print(model_g.most_similar(sad, topn=10))

[(saddening, 0.6763913631439209), (depressing, 0.6676110029220581), (saddened, 0.6352651715278625), (sorrowful, 0.6336953043937683), (heartbreaking, 0.6180269122123718), (heartbroken, 0.6099187135696411), (tragic, 0.6039361953735352), (pathetic, 0.5848405361175537), (Sad, 0.5826965570449829), (mournful, 0.5742306709289551)]

查找异常词

print(model_g.doesnt_match([fire, water, land, sea, air, car]))

car

可用的嵌入模型

Files and Versions 标签下,您可以看到以下4个可用的嵌入模型:

所有模型均包含1024维的词向量,除了 v_glove_300_d_2.0 包含300维的词向量。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作