shamotskyi/unsymbols-lg-simfaiss-symbols-lg-aug
收藏Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/shamotskyi/unsymbols-lg-simfaiss-symbols-lg-aug
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: name
dtype: string
- name: hash_average
dtype: string
- name: hash_phash
dtype: string
- name: hash_dhash
dtype: string
- name: hash_whash
dtype: string
- name: embeddings
list: float32
- name: faiss_sim_names
list: string
- name: faiss_sim_dists
list: float32
- name: min_faiss_dist
dtype: float32
splits:
- name: train
num_bytes: 18592141
num_examples: 9100
download_size: 18255636
dataset_size: 18592141
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:name,数据类型:字符串类型
- 平均哈希(hash_average):数据类型:字符串类型
- 感知哈希(hash_phash):数据类型:字符串类型
- 差异哈希(hash_dhash):数据类型:字符串类型
- 小波哈希(hash_whash):数据类型:字符串类型
- 嵌入向量(embeddings):列表类型,元素为float32单精度浮点数
- FAISS相似度匹配样本名称(faiss_sim_names):列表类型,元素为字符串类型
- FAISS相似度匹配距离值(faiss_sim_dists):列表类型,元素为float32单精度浮点数
- 最小FAISS匹配距离(min_faiss_dist):数据类型为float32单精度浮点数
数据集划分:
- 划分名称:训练集(train),字节数:18592141,样本数量:9100
下载大小:18255636
数据集存储总大小:18592141
配置项:
- 配置名称:默认配置(default),数据文件:
- 对应划分:训练集(train),文件路径:data/train-*
提供机构:
shamotskyi



