five

seanghay/SynthKhmer-10k

收藏
Hugging Face2024-04-11 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/seanghay/SynthKhmer-10k
下载链接
链接失效反馈
官方服务:
资源简介:
SynthKhmer-10k数据集包含图像和对应的文本信息,图像大小为896x672。数据集的特征包括图像和ground_truth,其中ground_truth包含bbox、dateOfBirth、fullName、gender等信息。数据集分为train部分,包含10000个样本,总大小为1172837507字节。数据集的创建背景图像来自`https://picsum.photos/`,人物照片来自`https://thispersondoesnotexist.com/`,名字来自高棉语词典。数据集的任务类别为image-to-text,语言为高棉语(km),许可证为cc-by-4.0。

SynthKhmer-10k数据集包含图像和对应的文本信息,图像大小为896x672。数据集的特征包括图像和ground_truth,其中ground_truth包含bbox、dateOfBirth、fullName、gender等信息。数据集分为train部分,包含10000个样本,总大小为1172837507字节。数据集的创建背景图像来自`https://picsum.photos/`,人物照片来自`https://thispersondoesnotexist.com/`,名字来自高棉语词典。数据集的任务类别为image-to-text,语言为高棉语(km),许可证为cc-by-4.0。
提供机构:
seanghay
原始信息汇总

数据集概述

数据集名称

  • 名称:SynthKhmer-10k
  • 别名:SynthKhmer 10k

数据集特征

  • 图像特征

    • 名称:image
    • 数据类型:图像
  • 地面实况特征

    • 结构化数据,包含以下子特征:
      • bbox:
        • h: 数据类型 float64
        • id: 数据类型 string
        • w: 数据类型 float64
        • x: 数据类型 float64
        • y: 数据类型 float64
      • dateOfBirth: 数据类型 string
      • fullName: 数据类型 string
      • gender: 数据类型 string
      • id: 数据类型 string
      • label_dateOfBirth: 数据类型 string
      • label_fullName: 数据类型 string
      • label_gender: 数据类型 string

数据集分割

  • 训练集
    • 名称:train
    • 示例数量:10000
    • 字节数:1172837507

数据集大小

  • 下载大小:1168963461
  • 数据集大小:1172837507

任务类别

  • 图像到文本

语言

  • km (Khmer)

大小类别

  • 10K<n<100K

许可证

  • cc-by-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作