five

shamotskyi/unsymbols-lg-simfaiss-symbols-lg-aug

收藏
Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/shamotskyi/unsymbols-lg-simfaiss-symbols-lg-aug
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: name dtype: string - name: hash_average dtype: string - name: hash_phash dtype: string - name: hash_dhash dtype: string - name: hash_whash dtype: string - name: embeddings list: float32 - name: faiss_sim_names list: string - name: faiss_sim_dists list: float32 - name: min_faiss_dist dtype: float32 splits: - name: train num_bytes: 18592141 num_examples: 9100 download_size: 18255636 dataset_size: 18592141 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: 特征字段: - 名称:name,数据类型:字符串类型 - 平均哈希(hash_average):数据类型:字符串类型 - 感知哈希(hash_phash):数据类型:字符串类型 - 差异哈希(hash_dhash):数据类型:字符串类型 - 小波哈希(hash_whash):数据类型:字符串类型 - 嵌入向量(embeddings):列表类型,元素为float32单精度浮点数 - FAISS相似度匹配样本名称(faiss_sim_names):列表类型,元素为字符串类型 - FAISS相似度匹配距离值(faiss_sim_dists):列表类型,元素为float32单精度浮点数 - 最小FAISS匹配距离(min_faiss_dist):数据类型为float32单精度浮点数 数据集划分: - 划分名称:训练集(train),字节数:18592141,样本数量:9100 下载大小:18255636 数据集存储总大小:18592141 配置项: - 配置名称:默认配置(default),数据文件: - 对应划分:训练集(train),文件路径:data/train-*
提供机构:
shamotskyi
二维码
社区交流群
二维码
科研交流群
商业服务