目录
摘要: 3
第一章 文档图像预处理概述 5
1.1 文档图像处理系统介绍 5
1.2 文档图像预处理 6
1.2.1 彩色图像转换为灰度图像,以及灰度图像的二值化 6
1.2.2 图像方向的自动检测与倾斜校正 7
1.2.3 版面结构理解 8
参考文献 10
第二章 传统的图像阈值化方法介绍 11
2.1 图像分割与图像阈值化概述 11
2.2 全局阈值选取方法 12
2.2.1 直方图与直方图变换方法 12
2.2.2 最大类间方差法(ostu方法) 14
2.2.3 最小误差法 15
2.2.4 概率松弛法(Relaxation) 16
2.2.5 最大熵方法 17
2.2.5.1 Shannon关于熵的定义 18
2.2.5.2 Pun的最大熵方法 18
2.2.5.3 Kapur,Sahoo和Wong的方法 20
2.2.5.4 Abutaleb的二维熵算法 20
2.2.5.5 Pal和Bhandari的条件熵方法 22
2.3 局部阈值方法与动态阈值选取 25
2.3.1 Chow和Kaneko的方法 27
2.3.2 Yanowitz和Bruckstein的方法 27
2.3.3 Sauvola和Pietikäinen的方法 28
参考文献 30
第三章 改进的算法:直接局域二值化方法 31
3.1 问题的提出 31
3.2 对问题的分析及解决方案的提出 33
3.3 直接局域二值化方法 33
3.3.1 将图像划分成为子区域 34
3.3.2 使用改进的条件熵方法进行阈值化 36
3.4 算法效果比较 42
参考文献 45
第四章 总结与展望 46
致谢 47
摘要:
作为信息的最重要载体,电子文档处理的研究引起人们极大的兴趣。在任何文档处理系统中,预处理极为重要,其效果好坏会严重地影响其它模块的工作。特别是灰度图像二值化效果的好坏,对识别效果以及其后的一切处理都有相当大的影响。原因之一是,任何物理传感输入都是灰度图像,文档处理系统的大多数模块却仅仅处理二值图像,图像二值化是必不可少的。此外,图像二值化本身也是数字图像处理中重要的基本问题。
本文首先介绍完整的文档处理系统以及其预处理模块,然后将重点放在二值化问题上,给出图像阈值化方法的综述,并对全局阈值化、局部动态阈值化等方法的优点和缺点给出评价。本文尤其针对灰度变化比较复杂的文档图像,提出了一种改进的动态阈值化算法,并以仿真实验与以往的全局方法进行了比较,证实所发展新方法的优势。本文对该新算法在具体应用中会遇到的问题也做了估计,并提出解决相应问题的基本原则。
关键词:预处理,灰度图像,二值化,阈值
Direct Local-thresholding Method for Gray-level Document Images
Abstract:
People have great interest in the study of document processing, as electronic document is the most important information carrier nowadays. In any document processing system, pre-processing plays an important role in that it affects all the later modules in the system. Among various pre-processing, gray-level image to binary- image conversion, or image binarization is a key. First, an image obtained with a sensor is essentially a grey-level image, but most modules in the processing system only deal with binary image, and binarization becomes a necessity. Second, binarization has it’s own basic research interest.
In this thesis, we first introduce the full document processing system and its preprocessing part; then we give special attention to the problem of binarization, and make a survey of various existing image thresholding methodologies, including global methods and local dynamic methods, with evaluations of their excellences and shortcomings. Then, aiming at the case of document image with complex gray-level variation, we bring forward an improved dynamic thresholding algorithm, named Direct Local-thresholding Method, which is proved to be better than former global method by simulating experiments. Finally, we discuss the problems may encountered in application systems, and put forward basic principles for possible solutions.
Key words: preprocess, gray-level image, binarization, threshold
学术论文网Tag:代写硕士论文
|