Titanic|泰坦尼克号数据集|乘客信息数据集
收藏
- 泰坦尼克号沉船事件发生,为后续数据集的形成奠定了基础。
- 数据集首次由罗杰·巴格利(Roger Baggle)在英国皇家统计学会的会议上提出,作为统计分析的案例。
- 数据集被收录于《数据集百科全书》(Encyclopedia of Datasets),进一步扩大了其影响力。
- 数据集首次应用于机器学习领域,成为分类算法的经典案例。
- 数据集在Kaggle平台上发布,吸引了全球数据科学家的关注和参与。
- 1Titanic: Machine Learning from DisasterKaggle · 2012年
- 2A Comparative Study of Machine Learning Algorithms for Predicting Survival on the TitanicIEEE · 2018年
- 3Predicting Titanic Survivors Using Ensemble MethodsElsevier · 2019年
- 4Exploring the Titanic Dataset: A Data-Driven Approach to Understanding SurvivalarXiv · 2020年
- 5Feature Engineering and Selection for Predicting Titanic SurvivorsMDPI · 2021年
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
中国省级灾害统计空间分布数据集(1999-2020年)
该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。
国家地球系统科学数据中心 收录
RadDet
RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。
github 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录