five

gips-mai/osv5m_ann

收藏
Hugging Face2024-07-08 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/gips-mai/osv5m_ann
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征字段,如图像ID、响应、描述编码、图像编码、ID、经纬度、缩略图原始URL、国家、序列、捕获时间、经纬度分箱、单元格、地区、子地区、城市、土地覆盖、道路指数、驾驶侧、气候、土壤、距离海洋的距离、四叉树编码、唯一地区、唯一子地区、唯一城市、唯一国家、创建者用户名、创建者ID、国家独热编码等。数据集被分为多个分割,每个分割包含不同数量的字节和示例。

This dataset contains multiple feature fields such as image ID, response, description encoding, image encoding, ID, latitude and longitude, thumbnail original URL, country, sequence, captured time, latitude and longitude binning, cell, region, sub-region, city, land cover, road index, drive side, climate, soil, distance to sea, quadtree encoding, unique region, unique sub-region, unique city, unique country, creator username, creator ID, country one-hot encoding, etc. The dataset is divided into multiple splits, each containing different numbers of bytes and examples.
提供机构:
gips-mai
原始信息汇总

数据集概述

数据集特征

  • img_id: 图像ID,类型为字符串。
  • resp: 响应信息,类型为字符串。
  • desc_encoding: 描述编码,类型为浮点数序列。
  • img_encoding: 图像编码,类型为浮点数序列。
  • id: 唯一标识符,类型为整数。
  • latitude: 纬度,类型为浮点数。
  • longitude: 经度,类型为浮点数。
  • thumb_original_url: 缩略图原始URL,类型为字符串。
  • country: 国家,类型为字符串。
  • sequence: 序列,类型为字符串。
  • captured_at: 捕获时间,类型为整数。
  • lon_bin: 经度分箱,类型为整数。
  • lat_bin: 纬度分箱,类型为整数。
  • cell: 单元格,类型为字符串。
  • region: 地区,类型为字符串。
  • sub-region: 子地区,类型为字符串。
  • city: 城市,类型为字符串。
  • land_cover: 土地覆盖类型,类型为整数。
  • road_index: 道路索引,类型为浮点数。
  • drive_side: 驾驶侧,类型为整数。
  • climate: 气候类型,类型为整数。
  • soil: 土壤类型,类型为整数。
  • dist_sea: 距海洋距离,类型为浮点数。
  • quadtree_10_5000: 四叉树编码,类型为整数。
  • quadtree_10_25000: 四叉树编码,类型为整数。
  • quadtree_10_1000: 四叉树编码,类型为整数。
  • quadtree_10_50000: 四叉树编码,类型为整数。
  • quadtree_10_12500: 四叉树编码,类型为整数。
  • quadtree_10_500: 四叉树编码,类型为整数。
  • quadtree_10_2500: 四叉树编码,类型为整数。
  • unique_region: 唯一地区,类型为字符串。
  • unique_sub-region: 唯一子地区,类型为字符串。
  • unique_city: 唯一城市,类型为字符串。
  • unique_country: 唯一国家,类型为字符串。
  • creator_username: 创建者用户名,类型为字符串。
  • creator_id: 创建者ID,类型为浮点数。
  • country_one_hot_enc: 国家独热编码,类型为整数序列。

数据集分割

  • 00: 包含1008个样本,占用17265609字节。
  • 01: 包含50000个样本,占用856211257字节。
  • 02: 包含50000个样本,占用856225082字节。
  • 03: 包含50000个样本,占用856194005字节。
  • 04: 包含50000个样本,占用856206224字节。

数据集大小

  • 下载大小: 2451455903字节。
  • 数据集大小: 3442102177字节。

配置

  • default:
    • 00: 数据路径为data/00-*
    • 01: 数据路径为data/01-*
    • 02: 数据路径为data/02-*
    • 03: 数据路径为data/03-*
    • 04: 数据路径为data/04-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作