seanghay/SynthKhmer-10k
收藏Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/seanghay/SynthKhmer-10k
下载链接
链接失效反馈官方服务:
资源简介:
SynthKhmer-10k数据集包含图像和对应的文本信息,图像大小为896x672。数据集的特征包括图像和ground_truth,其中ground_truth包含bbox、dateOfBirth、fullName、gender等信息。数据集分为train部分,包含10000个样本,总大小为1172837507字节。数据集的创建背景图像来自`https://picsum.photos/`,人物照片来自`https://thispersondoesnotexist.com/`,名字来自高棉语词典。数据集的任务类别为image-to-text,语言为高棉语(km),许可证为cc-by-4.0。
SynthKhmer-10k数据集包含图像和对应的文本信息,图像大小为896x672。数据集的特征包括图像和ground_truth,其中ground_truth包含bbox、dateOfBirth、fullName、gender等信息。数据集分为train部分,包含10000个样本,总大小为1172837507字节。数据集的创建背景图像来自`https://picsum.photos/`,人物照片来自`https://thispersondoesnotexist.com/`,名字来自高棉语词典。数据集的任务类别为image-to-text,语言为高棉语(km),许可证为cc-by-4.0。
提供机构:
seanghay
原始信息汇总
数据集概述
数据集名称
- 名称:SynthKhmer-10k
- 别名:SynthKhmer 10k
数据集特征
-
图像特征:
- 名称:image
- 数据类型:图像
-
地面实况特征:
- 结构化数据,包含以下子特征:
- bbox:
- h: 数据类型 float64
- id: 数据类型 string
- w: 数据类型 float64
- x: 数据类型 float64
- y: 数据类型 float64
- dateOfBirth: 数据类型 string
- fullName: 数据类型 string
- gender: 数据类型 string
- id: 数据类型 string
- label_dateOfBirth: 数据类型 string
- label_fullName: 数据类型 string
- label_gender: 数据类型 string
- bbox:
- 结构化数据,包含以下子特征:
数据集分割
- 训练集:
- 名称:train
- 示例数量:10000
- 字节数:1172837507
数据集大小
- 下载大小:1168963461
- 数据集大小:1172837507
任务类别
- 图像到文本
语言
- km (Khmer)
大小类别
- 10K<n<100K
许可证
- cc-by-4.0



