TCIA (The Cancer Imaging Archive)|癌症研究数据集|医学影像数据集
收藏
- TCIA首次由美国国家癌症研究所(NCI)和美国国家生物医学成像与生物工程研究所(NIBIB)联合发起,旨在创建一个公开的癌症影像数据库。
- TCIA正式上线,开始提供多种癌症类型的影像数据,包括肺癌、乳腺癌和脑癌等,为科研和临床应用提供支持。
- TCIA发布了首个大规模的多模态影像数据集,涵盖了多种癌症类型和影像技术,极大地丰富了研究资源。
- TCIA与多个国际研究机构合作,扩展了数据集的覆盖范围,增加了更多国家和地区的癌症影像数据。
- TCIA引入了新的数据管理工具和用户界面,提升了数据访问和使用的便捷性,进一步促进了科研和临床应用。
- TCIA发布了首个基于人工智能和机器学习的影像分析工具,标志着数据集在技术应用上的新突破。
- TCIA继续扩展其数据集,增加了更多类型的癌症影像数据,并加强了与全球科研机构的合作,推动了癌症影像研究的发展。
- 1The Cancer Imaging Archive (TCIA): Maintaining and Operating a Public Information RepositoryNational Institutes of Health · 2013年
- 2The Cancer Imaging Archive (TCIA): Data User’s GuideNational Institutes of Health · 2020年
- 3The Cancer Imaging Archive: A New Resource for Radiologic OncologyNational Institutes of Health · 2011年
- 4The Cancer Imaging Archive (TCIA): Supporting Open Access to Medical Image DataNational Institutes of Health · 2016年
- 5The Cancer Imaging Archive (TCIA): A Resource for Radiomics ResearchNational Institutes of Health · 2017年
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
LEVIR-CD
LEVIR-CD 是一个新的大规模遥感建筑变化检测数据集。引入的数据集将成为评估变化检测 (CD) 算法的新基准,尤其是基于深度学习的算法。 LEVIR-CD 由 637 个非常高分辨率(VHR,0.5m/像素)Google Earth (GE) 图像块对组成,大小为 1024 × 1024 像素。这些时间跨度为 5 到 14 年的双时相图像具有显着的土地利用变化,尤其是建筑增长。 LEVIR-CD涵盖别墅住宅、高层公寓、小型车库和大型仓库等各类建筑。在这里,我们关注与建筑相关的变化,包括建筑增长(从土壤/草地/硬化地面或在建建筑到新建筑区域的变化)和建筑衰退。这些双时相图像由遥感图像解释专家使用二进制标签(1 表示变化,0 表示不变)进行注释。我们数据集中的每个样本都由一个注释器进行注释,然后由另一个注释器进行双重检查以产生高质量的注释。完整注释的 LEVIR-CD 总共包含 31,333 个单独的变更构建实例。
OpenDataLab 收录