BJTU Visual Impression Dataset
收藏数据集概述
数据集名称
- 交大视觉印象数据集2024
数据集准备
-
数据结构 bash ${DATA_ROOT} ├── base │ ├── fh │ ├── mh │ ... │ ├── zx │ ├── util_pic ├── query │ ├── fh │ ├── mh │ ... │ ├── zx
-
默认数据路径
${DATA_ROOT}默认设置为./data。
-
数据处理
- 运行
split.py分割util_pic中的图像,按标签分为17个类别。 - 删除
util_pic。
- 运行
-
训练数据集
- 包含 6445 张图像,分为 25 个类别。
数据集使用
-
模型微调
-
AlexNet w/o latent layer shell python finetune.py --model alexnet --batchsize 64 --lr 0.001 --num_epochs 300 --data ./your/data/path --seed 42
-
AlexNet w/ latent layer shell python finetune.py --model alexnet --batchsize 64 --lr 0.001 --num_epochs 300 --data ./your/data/path --seed 42 --latent_layer --latent_size 48
-
ResNet-50 w/o latent layer shell python finetune.py --model resnet --batchsize 64 --lr 0.001 --num_epochs 300 --data ./your/data/path --seed 42
-
-
图像检索
-
AlexNet w/o latent layer shell python retrieval.py --model alexnet --data ./your/data/path --dist [cos/euclidean] [--plot]
-
AlexNet w/ latent layer shell python retrieval.py --model alexnet --data ./your/data/path --latent_layer --dist [cos/euclidean] [--plot]
-
ResNet-50 w/o latent layer shell python retrieval.py --model resnet --data ./your/data/path --dist [cos/euclidean] [--plot]
-
结果示例
-
AlexNet w/o latent layer (cosine_similarity)
- 结果图像位于
./plots/your_model_name/20中的08.png。 - 性能指标图像位于
./plots/your_model_name中的P@K.png。
- 结果图像位于
-
AlexNet w/o latent layer (euclidean_dist)
- 性能指标图像位于
./plots/your_model_name中的P@K-1717172575382-1.png。
- 性能指标图像位于
-
AlexNet w/ latent layer (binary + cosine_similarity)
- 结果图像位于
./plots/your_model_name/20中的08.png。 - 性能指标图像位于
./plots/your_model_name中的P@K.png。
- 结果图像位于
-
AlexNet w/ latent layer (binary + euclidean_dist)
- 性能指标图像位于
./plots/your_model_name中的P@K-1717172715739-3.png。
- 性能指标图像位于
-
ResNet-50 w/o latent layer (cosine_similarity)
- 结果图像位于
./plots/your_model_name/60中的16.png。 - 性能指标图像位于
./plots/your_model_name中的P@K.png。
- 结果图像位于
-
ResNet-50 w/o latent layer (euclidean_dist)
- 性能指标图像位于
./plots/your_model_name中的P@K-1717172893845-5.png。
- 性能指标图像位于




