2007年1月18日星期四

《数码相机拍图OCR心得》

《数码相机拍图OCR心得》
首先介绍一下几种OCR软件的比较
自从2000年以来,也偶尔做做图片的OCR处理。用过的软件包括丹青、清华紫光、尚书、CAJVIEWER的OCR、汉王等几种,以下简单说一下感受。
丹青是最早用的,当时好像是3.0版本,总体感觉——识别率不是特别高,是否因为它本来是开发作为繁体用的呢。
清华紫光,当时用的是2000版本,还不是很好用。
后来比较常用的是尚书,5.0,6.0,7.0等几个版本,它可以进行表格的识别,不过个人觉得识别的还不大好。但是尚书的识别率还是挺高的,也有校正、去污点、分块等功能。
CAJVIEWER的OCR功能主要是针对他们出的CAJ期刊的,对PDF也可以,由于CAJ期刊的格式问题,这种文件用它自带的软件来识别,识别率还是很高的,就是速度比较慢。
后来由于要批量OCR一本书,找到了汉王,汉王的操作也挺人性化的,但是经常会由于一次识别的图象太多而导致出错,识别率倒是不错。

采用扫描仪得到的图片一般来说要比数码相机得到的效果好,但是由于扫描仪占地较大,一般也不经常拿出来用,有时候用数码相机也可以得到不错的效果。

下面顺便讲讲怎么对数码相机或者扫描仪得到的图象进行一定的处理,使其能够有更高的识别率。
我主要用的软件是一个很老的版本PAINT SHOP PRO(简称PSP,几经易主之后,现在已经是COREL旗号了)
在这里面主要调整的部件有几个
1)亮度和对比度(shift+b)和色调、饱和度、亮度(shift+h)
这个的好处是两个工具同时使用,可以使得一个是宏观调控,一个是微调,数字不需要变化,可以连续用键盘完成。
2)灰度系数调整
这个在psp里面是shift+g,有时候图象对比度不强的时候,用调整亮度和对比度的方法会使得字体变得很模糊,导致无法识别,而此时可以适当的采用shift+g,将图象先调黑,之后再进行亮度和对比度调整,就可以使得效果更好些。
比如以下是几张图片在照相之后的调整结果,可以看到可以处理的不错,识别率也比较高。
对于制作课件的时候需要对书本图形进行操作的也可以用这种方法。

由于以上是本人自己摸索的结果,应该有更好的操作效果,也请各位多多指教。