MP-IDB: The Malaria Parasite Image Database for Image Processing and Analysis|医学图像分析数据集|疟疾研究数据集
收藏数据集概述
多物种 Plasmodium
- 数据来源: andrealoddo/MP-IDB-The-Malaria-Parasite-Image-Database-for-Image-Processing-and-Analysis
- 数据类型: 薄涂片图像
- 图像数量: 229张,包括122张Plasmodium falciparum图像,37张P. malariae图像,29张P. ovale图像和46张P. vivax图像。
- 附加信息: 图像掩码指定寄生虫位置。每个图像的编号前缀相同,表示来自同一患者。
- 参考文献: Loddo A., Di Ruberto C., Kocher M., Prod’Hom G. (2019) MP-IDB: The Malaria Parasite Image Database for Image Processing and Analysis
Plasmodium falciparum
-
数据来源1: lhncbc.nlm.nih.gov/LHC-research/LHC-projects/image-processing/malaria-datasheet.html
-
数据类型: 薄涂片图像
-
图像数量: 27,558张,包括感染和未感染的红细胞。
-
参考文献: Sivaramakrishnan Rajaraman, Sameer K. Antani, Mahdieh Poostchi, Kamolrat Silamut, Md. A. Hossain, Richard J. Maude, Stefan Jaeger, and George R. Thoma. Pre-trained convolutional neural networks as feature extractors toward improved malaria parasite detection in thin blood smear images.
-
数据类型: 薄涂片图像
-
图像数量: 38,000张,所有图像由五个指定注释者标记五次。
-
参考文献: Mira S. Davidson, Sabrina Yahiya, Jill Chmielewski, Aidan J. O’Donnell, Pratima Gurung, Myriam Jeninga, Parichat Prommana, Dean Andrew, Michaela Petter, Chairat Uthaipibull, Michelle Boyle, George W. Ashdown, Jeffrey D. Dvorin, Sarah E. Reece, Danny W. Wilson,, D. Michael Ando, Michelle Dimon and Jake Baum Automated detection and staging of malaria parasites from cytological smears using convolutional neural networks
-
数据来源3: lhncbc.nlm.nih.gov/LHC-research/LHC-projects/image-processing/malaria-datasheet.html
-
数据类型: 点集和多边形集
-
图像数量: 多边形集165张,点集800张。
-
参考文献: Kassim, Y.M., Palaniappan, K., Yang, F., Poostchi, M., Palaniappan, N., Maude, R.J., Antani, S. and Jaeger, S.,Clustering-Based Dual Deep Learning Architecture for Detecting Red Blood Cells in Malaria Diagnostic Smears
-
数据来源4: lhncbc.nlm.nih.gov/LHC-research/LHC-projects/image-processing/malaria-datasheet.html
-
数据类型: 厚涂片图像
-
图像数量: 1819张。
-
参考文献: Yang, F., Poostchi, M., Yu, H., Zhou, Z., Silamut, K., Yu, J., Maude, R.J., Jaeger, S. and Antani, S. Deep Learning for Smartphone-Based Malaria Parasite Detection in Thick Blood Smears
-
数据来源5: data.lhncbc.nlm.nih.gov/public/Malaria/MalariaScreener/index.html
-
数据类型: 厚涂片图像
-
图像数量: 190张。
-
参考文献: Yu, Hang, et al. Patient-level performance evaluation of a smartphone-based malaria diagnostic application
-
数据类型: 厚涂片图像
-
图像数量: 1182张,包含寄生虫边界框。
-
参考文献: J.A. Quinn, R. Nakasi, P.K. Mugagga, P. Byanyima, W. Lubega, A. Andama. Deep Convolutional Neural Networks for Microscopy-Based Point of Care Diagnostics.
-
数据来源7: https://drive.google.com/open?id=1EMJ7dg0TBs34sDWcj7Tj1wozXJC0wtbc
-
数据类型: 薄涂片图像
-
图像数量: 655张,包含寄生虫边界框。
-
参考文献: Tek FB, Dempster AG, Kale I, Parasite detection and identification for automated thin blood film malaria diagnosis.
-
数据类型: 厚涂片图像
-
图像数量: 来自299名患者的Giemsa染色厚血片。
-
参考文献: Manescu, Petru, et al. A weakly supervised deep learning approach for detecting malaria and sickle cells in blood films.
Plasmodium vivax
- 数据来源: https://data.broadinstitute.org/bbbc/BBBC041/malaria.zip
- 数据类型: 薄涂片图像
- 图像数量: 1364张,约80,000个细胞。
- 参考文献: Hung J, Goodman A, Lopes S, Rangel G, Ravel D, Costa F, Duraisingh M, Marti M, Carpenter A. Applying Faster R-CNN for Object Detection on Malaria Images.

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Amazon电影评论数据集
该数据集包含从1997年8月至2012年10月期间,Amazon用户对253,059种产品的7,911,684条评论。数据集被添加了真实标签,这些标签是通过爬取/抓取Amazon.com获得的,用于分类产品。
github 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
UAVDT Dataset
The authors constructed a new UAVDT Dataset focused on complex scenarios with new level challenges. Selected from 10 hours raw videos, about 80, 000 representative frames are fully annotated with bounding boxes as well as up to 14 kinds of attributes (e.g., weather condition, flying altitude, camera view, vehicle category, and occlusion) for three fundamental computer vision tasks: object detection, single object tracking, and multiple object tracking.
datasetninja.com 收录
Materials Project 在线材料数据库
Materials Project 是一个由伯克利加州大学和劳伦斯伯克利国家实验室于 2011 年共同发起的大型开放式在线材料数据库。这个项目的目标是利用高通量第一性原理计算,为超过百万种无机材料提供全面的性能数据、结构信息和计算模拟结果,以此加速新材料的发现和创新过程。数据库中的数据不仅包括晶体结构和能量特性,还涵盖了电子结构和热力学性质等详尽信息,为研究人员提供了丰富的材料数据资源。相关论文成果为「Commentary: The Materials Project: A materials genome approach to accelerating materials innovation」。
超神经 收录