shamotskyi/symbols-lg-hash
收藏Hugging Face2026-04-16 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/shamotskyi/symbols-lg-hash
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: unicode_hex
dtype: string
- name: unicode_name
dtype: string
- name: font_name
dtype: string
- name: character
dtype: string
- name: transform
dtype: string
- name: name
dtype: string
- name: hash_average
dtype: string
- name: hash_phash
dtype: string
- name: hash_dhash
dtype: string
- name: hash_whash
dtype: string
- name: embeddings
list: float32
splits:
- name: train
num_bytes: 50229750
num_examples: 29182
download_size: 46925975
dataset_size: 50229750
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名:Unicode十六进制编码(unicode_hex),数据类型:字符串
- 字段名:Unicode字符名称(unicode_name),数据类型:字符串
- 字段名:字体名称(font_name),数据类型:字符串
- 字段名:字符(character),数据类型:字符串
- 字段名:变换参数(transform),数据类型:字符串
- 字段名:样本名称(name),数据类型:字符串
- 字段名:平均哈希值(hash_average),数据类型:字符串
- 字段名:感知哈希值(hash_phash),数据类型:字符串
- 字段名:差异哈希值(hash_dhash),数据类型:字符串
- 字段名:小波哈希值(hash_whash),数据类型:字符串
- 字段名:嵌入向量(embeddings),数据类型:单精度浮点数(float32)列表
数据拆分:
- 拆分名称:训练集(train),占用字节数:50229750,样本总数:29182
下载总大小:46925975 字节
数据集总存储大小:50229750 字节
配置项:
- 配置名称:默认配置(default),数据文件:
- 对应拆分:训练集(train),文件路径:data/train-*
提供机构:
shamotskyi



