1、选择扫描仪
若计算机已经安装了扫描仪及其驱动程序,则出现TWAIN的对话框,选择所安装的计算机。
若尚未安装扫描仪,应按扫描仪的安装要求进行驱动程序的安装,扫描仪一旦选定以后不能再选择。
2、扫描设置 A、使用TWAIN扫描界面
这是使用扫描仪自己的界面进行扫描图像,
B、直接终扫
这是使用OCR系统自己的界面进行扫描图像,此时需要同时设定对话框下部所示的扫描参数。
(1)亮度
注意:
亮度参数的确定决定了扫描图像的明暗程度,亮度太高,文章笔划断裂而残缺不全。亮度太低,则文字笔划黑成一团。两种情况都会影响扫描结果。因此认真细致的选择好亮度是获得较好的识别率的基本保证。
建议:
扫描比较浅的文字或者底色白、纸张发亮以及文字笔画细的文件时,亮度参数应选择低些。即加黑加暗。书刊、杂志的底色较白,宋体字。仿宋体字的笔画粗细适中,在扫描这类文件时可选择中等亮度。识别较小的文字时,亮度参数应高些,以不出现太多的断笔为限。
(2)分辨率
分辨率是扫描仪也是OCR系统的一个重要参数,它决定着扫描图像的清晰程度。也决定着所能扫描的图像细节,文本识别正确率的高低与扫描分辨率的设定有很大的关系。分辨率DPI就是每英寸点数。
分辨率选择对照表
文字大小 |
准确分辨率(DPI) |
推荐使用分辨率(DPI) |
1号 (26磅) |
150 |
200 |
2号 (22磅) |
180 |
3号 (16磅) |
200 |
4号 (14磅) |
240 |
300 |
小4号 (12磅) |
280 |
5号 (10.5磅) |
300 |
小5号 (9磅) |
350 |
400 |
6号 (7.5磅) |
400 |
7号 (5.5磅) |
500 |
600 |
8号 (5磅) |
600 |