shamotskyi/unsymbols-lg-sim-symbols-png
收藏Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/shamotskyi/unsymbols-lg-sim-symbols-png
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: name
dtype: string
- name: png
dtype: image
- name: hash_average
dtype: string
- name: hash_phash
dtype: string
- name: hash_dhash
dtype: string
- name: hash_whash
dtype: string
- name: embeddings
list: float32
- name: faiss_sim_names
list: string
- name: faiss_sim_dists
list: float32
- name: min_faiss_dist
dtype: float32
- name: min_dhash_dist
dtype: int64
- name: hash_dhash_sim_names
list: string
- name: hash_dhash_sim_dists
list: int64
splits:
- name: train
num_bytes: 69512373
num_examples: 9100
download_size: 69245096
dataset_size: 69512373
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:名称,数据类型:字符串
- 字段名:png图像,数据类型:图像
- 字段名:平均哈希(Average Hash),数据类型:字符串
- 字段名:感知哈希(pHash),数据类型:字符串
- 字段名:差异哈希(dHash),数据类型:字符串
- 字段名:小波哈希(wHash),数据类型:字符串
- 字段名:嵌入向量,数据类型:float32类型列表
- 字段名:FAISS(Facebook AI Similarity Search)相似度匹配结果名称列表,数据类型:字符串列表
- 字段名:FAISS相似度匹配结果距离列表,数据类型:float32类型列表
- 字段名:最小FAISS相似度距离,数据类型:float32
- 字段名:最小差异哈希距离,数据类型:int64
- 字段名:差异哈希相似度匹配结果名称列表,数据类型:字符串列表
- 字段名:差异哈希相似度匹配结果距离列表,数据类型:int64类型列表
数据集划分:
- 划分名称:训练集,字节占用量:69512373,样本数量:9100
下载大小:69245096 字节
数据集总占用大小:69512373 字节
配置项:
- 配置名称:默认配置,数据文件:
- 数据集划分:训练集,文件路径:data/train-*
提供机构:
shamotskyi



