摘要:视盘是眼部的重要组织结构,它的形状、边界、大小和病理性凹陷等特征是判断眼底病变的重要辅助参数,因此视盘的自动检测对眼科疾病的计算机辅助诊断具有非常重要的意义。而由于眼底病变的影响,很多视盘定位难度较大,传统的算法大多是针对某种病变精度较高,不能适用于所有的病变类别,鲁棒性不高。
而在自然图像中,自从深度学习被成功引入目标检测以来,目标检测与定位取得了巨大的突破。本文将基于深度学习的目标检测算法引入视盘定位的实验中,采用Faster R-CNN+ZF的方法实现眼底图像中视盘的定位,首先对训练集进行训练得到训练的最终模型,接着在测试阶段使用这个模型实现对测试集图片中视盘位置的自动检测。本文选取来自Kaggle数据集的四千幅眼底图像,最终得出mAP值为99.4%。
关键词: 视盘定位,目标检测,Faster R-CNN
目录
中文摘要
Abstract
第一章 绪论3
1.1 研究背景及意义3
1.2 目标检测的发展历史和研究现状3
1.3 目标检测的发展新趋势4
1.4 论文结构安排4
第二章Faster R-CNN理论基础5
2.1 R-CNN介绍5
2.1.1 selective-search算法5
2.1.2 CNN(Convolutional Neural Networks)卷积神经网络7
2.2 Faster R-CNN候选区域提取方法RPN (Region Proposal Networks)8
2.2.1 RPN的核心思想8
2.2.2 Anchor机制8
2.2.3 RPN平移不变性10
2.3 Faster R-CNN流程介绍10
2.3.1 Fast R-CNN流程11
2.3.2 RoI pooling layer(卷积池化层)11
2.3.3初始化预训练(Pre-trained)网络12
2.3.4 Fine-tuning特定区域的微调12
2.3.5 Multi-task loss多任务损失函数12
2.3.6 SGD随机梯度下降13
2.4 ZF-net网络结构
第三章 基于Faster R-CNN的视盘定位过程14
3.1 图像预处理14
3.1.1 图像预处理python代码原理14
3.1.2 制作数据集16
3.2 Faster R-CNN训练17
3.2.1 训练准备17
3.2.2 训练过程18
3.3 训练结果19
- 3.3.1 mAP19
- 3.3.2 训练结果分析19
第四章 实验结果及分析23
第五章 总结24
参考文献26
致谢28