five

MikeGreen2710/12_jun_hn_outlier

收藏
Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeGreen2710/12_jun_hn_outlier
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个与地理位置和统计指标相关的字段,如街道、区、道路宽度、价格每平方米、中位数、绝对距离、MAD、Z分数等。推测该数据集可能用于房地产价格分析或地理空间数据分析。

This dataset contains multiple fields related to geographic locations and statistical indicators, such as street, district, road width, price per square meter, median, absolute distance, MAD, Z-score, etc. It is speculated that this dataset may be used for real estate price analysis or geospatial data analysis.
提供机构:
MikeGreen2710
原始信息汇总

数据集概述

特征信息

  • id: 字符串类型
  • price_m2: 浮点数类型
  • street: 字符串类型
  • ward: 字符串类型
  • district: 字符串类型
  • road_wide_std: 浮点数类型
  • cnt: 浮点数类型
  • median: 浮点数类型
  • abs_distance: 浮点数类型
  • MAD: 浮点数类型
  • median_ward_road_wide: 浮点数类型
  • cnt_ward_road_wide: 浮点数类型
  • abs_distance_ward_road_wide: 浮点数类型
  • MAD_ward_road_wide: 浮点数类型
  • median_district_road_wide: 浮点数类型
  • cnt_district_road_wide: 浮点数类型
  • abs_distance_district_road_wide: 浮点数类型
  • MAD_district_road_wide: 浮点数类型
  • median_street: 浮点数类型
  • cnt_street: 浮点数类型
  • abs_distance_street: 浮点数类型
  • MAD_street: 浮点数类型
  • median_ward: 浮点数类型
  • cnt_ward: 浮点数类型
  • abs_distance_ward: 浮点数类型
  • MAD_ward: 浮点数类型
  • median_district: 浮点数类型
  • cnt_district: 浮点数类型
  • abs_distance_district: 浮点数类型
  • MAD_district: 浮点数类型
  • median_road_wide: 浮点数类型
  • cnt_road_wide: 浮点数类型
  • abs_distance_road_wide: 浮点数类型
  • MAD_road_wide: 浮点数类型
  • z_score: 浮点数类型
  • z_score_ward_road_wide: 浮点数类型
  • z_score_district_road_wide: 浮点数类型
  • z_score_road_wide: 浮点数类型
  • z_score_street: 浮点数类型
  • z_score_ward: 浮点数类型
  • z_score_district: 浮点数类型
  • z_score_street_road_wide_within_3: 浮点数类型
  • z_score_ward_road_wide_within_3: 浮点数类型
  • z_score_district_road_wide_within_3: 浮点数类型
  • total_z_score: 浮点数类型
  • total_weight: 整数类型
  • final_z_score: 浮点数类型
  • outlier: 整数类型
  • index_level_0: 整数类型

数据集分割

  • train:
    • 样本数量: 1,040,872
    • 数据大小: 472,101,149 字节

数据集大小

  • 下载大小: 269,560,139 字节
  • 数据集总大小: 472,101,149 字节

配置信息

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作