MikeGreen2710/past_to_25_01_01_split_part_6
收藏Hugging Face2026-03-12 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeGreen2710/past_to_25_01_01_split_part_6
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: int64
- name: title
dtype: string
- name: description
dtype: string
- name: address
dtype: string
- name: embed_text
dtype: string
- name: post_date_std
dtype: timestamp[ns]
- name: price_std
dtype: float64
- name: source
dtype: string
- name: url
dtype: string
- name: agent_name
dtype: string
- name: agent_phone
dtype: string
- name: street_std
dtype: string
- name: door_direction_std
dtype: string
- name: number_of_floors_std
dtype: float64
- name: house_front_std
dtype: float64
- name: road_width_std
dtype: float64
- name: total_wid_std
dtype: float64
- name: total_len_std
dtype: float64
- name: agri_area_std
dtype: float64
- name: resi_area_std
dtype: float64
- name: resi_cons_area_std
dtype: float64
- name: total_area_std
dtype: float64
- name: location
dtype: int64
- name: project
dtype: int64
- name: agriculture_forestry
dtype: int64
- name: structure_focus
dtype: int64
- name: province_code
dtype: float64
- name: district_code
dtype: float64
- name: ward_code
dtype: float64
- name: matched_province
dtype: string
- name: matched_district
dtype: string
- name: matched_ward
dtype: string
- name: region
dtype: string
- name: province_ner
dtype: string
- name: district_ner
dtype: string
- name: ward_ner
dtype: string
- name: street_ner
dtype: string
- name: province_probability
dtype: string
- name: district_probability
dtype: string
- name: ward_probability
dtype: string
- name: street_probability
dtype: string
- name: province_score
dtype: float64
- name: district_score
dtype: float64
- name: ward_score
dtype: float64
- name: location_probability
dtype: float32
- name: project_probability
dtype: float32
- name: agriculture_forestry_probability
dtype: float32
- name: structure_focus_probability
dtype: float32
- name: resolution_info
dtype: string
- name: resi_area_need_review
dtype: bool
- name: resi_cons_area_need_review
dtype: bool
- name: agri_area_need_review
dtype: bool
splits:
- name: train
num_bytes: 5057683623
num_examples: 2000000
download_size: 2184268764
dataset_size: 5057683623
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征字段:
- 名称:id,数据类型:int64(64位整数)
- 名称:title,数据类型:string(字符串)
- 名称:description,数据类型:string(字符串)
- 名称:address,数据类型:string(字符串)
- 名称:embed_text,数据类型:string(字符串)
- 名称:post_date_std,数据类型:timestamp[ns](纳秒级时间戳)
- 名称:price_std,数据类型:float64(64位浮点数)
- 名称:source,数据类型:string(字符串)
- 名称:url,数据类型:string(字符串)
- 名称:agent_name,数据类型:string(字符串)
- 名称:agent_phone,数据类型:string(字符串)
- 名称:street_std,数据类型:string(字符串)
- 名称:door_direction_std,数据类型:string(字符串)
- 名称:number_of_floors_std,数据类型:float64(64位浮点数)
- 名称:house_front_std,数据类型:float64(64位浮点数)
- 名称:road_width_std,数据类型:float64(64位浮点数)
- 名称:total_wid_std,数据类型:float64(64位浮点数)
- 名称:total_len_std,数据类型:float64(64位浮点数)
- 名称:agri_area_std,数据类型:float64(64位浮点数)
- 名称:resi_area_std,数据类型:float64(64位浮点数)
- 名称:resi_cons_area_std,数据类型:float64(64位浮点数)
- 名称:total_area_std,数据类型:float64(64位浮点数)
- 名称:location,数据类型:int64(64位整数)
- 名称:project,数据类型:int64(64位整数)
- 名称:agriculture_forestry,数据类型:int64(64位整数)
- 名称:structure_focus,数据类型:int64(64位整数)
- 名称:province_code,数据类型:float64(64位浮点数)
- 名称:district_code,数据类型:float64(64位浮点数)
- 名称:ward_code,数据类型:float64(64位浮点数)
- 名称:matched_province,数据类型:string(字符串)
- 名称:matched_district,数据类型:string(字符串)
- 名称:matched_ward,数据类型:string(字符串)
- 名称:region,数据类型:string(字符串)
- 名称:province_ner,数据类型:string(字符串)
- 名称:district_ner,数据类型:string(字符串)
- 名称:ward_ner,数据类型:string(字符串)
- 名称:street_ner,数据类型:string(字符串)
- 名称:province_probability,数据类型:string(字符串)
- 名称:district_probability,数据类型:string(字符串)
- 名称:ward_probability,数据类型:string(字符串)
- 名称:street_probability,数据类型:string(字符串)
- 名称:province_score,数据类型:float64(64位浮点数)
- 名称:district_score,数据类型:float64(64位浮点数)
- 名称:ward_score,数据类型:float64(64位浮点数)
- 名称:location_probability,数据类型:float32(32位浮点数)
- 名称:project_probability,数据类型:float32(32位浮点数)
- 名称:agriculture_forestry_probability,数据类型:float32(32位浮点数)
- 名称:structure_focus_probability,数据类型:float32(32位浮点数)
- 名称:resolution_info,数据类型:string(字符串)
- 名称:resi_area_need_review,数据类型:bool(布尔类型)
- 名称:resi_cons_area_need_review,数据类型:bool(布尔类型)
- 名称:agri_area_need_review,数据类型:bool(布尔类型)
数据划分:
- 划分名称:train(训练集),字节数:5057683623,样本数:2000000
下载大小:2184268764
数据集总大小:5057683623
配置项:
- 配置名称:default(默认配置),数据文件:
- 划分:train(训练集),数据路径:data/train-*
提供机构:
MikeGreen2710



