yuvidhepe/us-accidents-updated|交通事故数据集|交通数据分析数据集
收藏数据集概述
数据集名称
- 名称: US Accidents (2016 - 2023)
数据集内容
- 描述: 这是一个覆盖美国49个州的汽车事故数据集,数据收集自2016年2月至2023年3月,通过多个提供实时交通事件数据的API获取。
- 数据量: 包含约770万条事故记录。
数据集特征
- 特征列表:
- ID (字符串)
- Source (字符串)
- Severity (整数)
- Start_Time (字符串)
- End_Time (字符串)
- Start_Lat (浮点数)
- Start_Lng (浮点数)
- End_Lat (浮点数)
- End_Lng (浮点数)
- Distance(mi) (浮点数)
- Description (字符串)
- Street (字符串)
- City (字符串)
- County (字符串)
- State (字符串)
- Zipcode (字符串)
- Country (字符串)
- Timezone (字符串)
- Airport_Code (字符串)
- Weather_Timestamp (字符串)
- Temperature(F) (浮点数)
- Wind_Chill(F) (浮点数)
- Humidity(%) (浮点数)
- Pressure(in) (浮点数)
- Visibility(mi) (浮点数)
- Wind_Direction (字符串)
- Wind_Speed(mph) (浮点数)
- Precipitation(in) (浮点数)
- Weather_Condition (字符串)
- Amenity (布尔值)
- Bump (布尔值)
- Crossing (布尔值)
- Give_Way (布尔值)
- Junction (布尔值)
- No_Exit (布尔值)
- Railway (布尔值)
- Roundabout (布尔值)
- Station (布尔值)
- Stop (布尔值)
- Traffic_Calming (布尔值)
- Traffic_Signal (布尔值)
- Turning_Loop (布尔值)
- Sunrise_Sunset (字符串)
- Civil_Twilight (字符串)
- Nautical_Twilight (字符串)
- Astronomical_Twilight (字符串)
数据集大小
- 下载大小: 1088140045字节
- 数据集大小: 3147354997字节
数据集分割
- 训练集:
- 大小: 3147354997字节
- 记录数: 7728394条
许可证
- 许可证: cc-by-nc-sa-4.0
数据集用途
- 用途: 仅供研究使用,适用于实时汽车事故预测、事故热点位置研究、伤亡分析、事故原因与效果规则提取,以及研究降水或其他环境因素对事故发生的影响。
联系信息
- 联系邮箱: moosavi.3@osu.edu

THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
中国高分辨率高质量PM2.5数据集(2000-2023)
ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。
国家青藏高原科学数据中心 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
全国景区数据
中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。 CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!
CnOpenData 收录
Houston2013, Berlin, Augsburg
本研究发布了三个多模态遥感基准数据集:Houston2013(高光谱和多光谱数据)、Berlin(高光谱和合成孔径雷达数据)和Augsburg(高光谱、合成孔径雷达和数字表面模型数据)。这些数据集用于土地覆盖分类,旨在通过共享和特定特征学习模型(S2FL)评估多模态基线。数据集包含不同模态和分辨率的图像,适用于评估和开发新的遥感图像处理技术。
arXiv 收录