SEER|癌症研究数据集|公共卫生数据集
收藏
- SEER数据集首次由美国国家癌症研究所(NCI)启动,旨在收集和分析美国各地的癌症发病率和生存率数据。
- SEER数据集首次发布,涵盖了美国17个地区的癌症病例数据,标志着癌症流行病学研究的重要里程碑。
- SEER数据集扩展至覆盖美国20个地区,增加了数据的地理覆盖范围,提升了数据集的代表性。
- SEER数据集引入计算机化数据管理系统,显著提高了数据处理和分析的效率。
- SEER数据集进一步扩展,覆盖了美国近26%的人口,成为全球最大的癌症登记数据集之一。
- SEER数据集开始提供在线数据访问服务,使得研究人员能够更便捷地获取和分析数据。
- SEER数据集引入新的数据收集标准,包括更详细的分子病理学信息,提升了数据集的科学价值。
- SEER数据集发布最新的数据更新,涵盖了超过40年的癌症病例数据,继续为全球癌症研究提供重要支持。
- 1The Surveillance, Epidemiology, and End Results (SEER) Program of the National Cancer InstituteNational Cancer Institute · 2002年
- 2Cancer Statistics, Trends, and Multiple Primary Cancer Analyses from the Surveillance, Epidemiology, and End Results (SEER) ProgramNational Cancer Institute · 2007年
- 3The SEER-Medicare Data: A National ResourceNational Cancer Institute · 2012年
- 4Using the SEER-Medicare Data to Study Cancer Outcomes and Quality of CareNational Cancer Institute · 2014年
- 5Cancer Statistics in the United States: An Overview from the SEER ProgramNational Cancer Institute · 2020年
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
NuminaMath-CoT
数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。
huggingface 收录
Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录