MikeGreen2710/training_data_road_features_merged_fixed
收藏Hugging Face2026-03-20 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/MikeGreen2710/training_data_road_features_merged_fixed
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: on_front_street
dtype: int64
- name: on_front_street_probability
dtype: float32
- name: source
dtype: string
- name: agent_name
dtype: string
- name: agent_phone
dtype: string
- name: matched_province
dtype: string
- name: id
dtype: int64
- name: road_width_proxy
dtype: string
- name: dist_to_main_street
dtype: string
- name: dist_to_car_alley
dtype: string
- name: dist_to_tricycle_alley
dtype: string
- name: is_through_alley
dtype: string
- name: has_sidewalk
dtype: string
- name: sidewalk_width_m
dtype: float64
- name: raw_road_description
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 17429695
num_examples: 13190
download_size: 8245770
dataset_size: 17429695
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
dataset_info:
features:
- 特征名称: text(文本)
数据类型: 字符串(string)
- 特征名称: on_front_street(前街标记)
数据类型: 64位整数(int64)
- 特征名称: on_front_street_probability(前街标记概率)
数据类型: 32位浮点数(float32)
- 特征名称: source(数据来源)
数据类型: 字符串(string)
- 特征名称: agent_name(标注代理名称)
数据类型: 字符串(string)
- 特征名称: agent_phone(标注代理联系方式)
数据类型: 字符串(string)
- 特征名称: matched_province(匹配省份)
数据类型: 字符串(string)
- 特征名称: id(样本编号)
数据类型: 64位整数(int64)
- 特征名称: road_width_proxy(道路宽度替代特征)
数据类型: 字符串(string)
- 特征名称: dist_to_main_street(至主街道的距离)
数据类型: 字符串(string)
- 特征名称: dist_to_car_alley(至机动车巷弄的距离)
数据类型: 字符串(string)
- 特征名称: dist_to_tricycle_alley(至三轮车巷弄的距离)
数据类型: 字符串(string)
- 特征名称: is_through_alley(是否为通行巷弄)
数据类型: 字符串(string)
- 特征名称: has_sidewalk(是否设置人行道)
数据类型: 字符串(string)
- 特征名称: sidewalk_width_m(人行道宽度,单位:米)
数据类型: 64位浮点数(float64)
- 特征名称: raw_road_description(原始道路描述文本)
数据类型: 字符串(string)
- 特征名称: __index_level_0__(索引层级0)
数据类型: 64位整数(int64)
splits:
- 划分名称: train(训练集)
占用字节数: 17429695
样本数量: 13190
下载大小: 8245770
数据集总大小: 17429695
configs:
- 配置名称: default(默认配置)
数据文件:
- 划分: train(训练集)
路径: data/train-*
提供机构:
MikeGreen2710



