OCR文字距离太近应该如何处理?

2019-07-17 22:03发布

本帖最后由 uiaxiaobo 于 2015-5-5 09:14 编辑

       在下使用 labview 5个月左右,基本上一直做一些控制万用表、光谱仪、功率计等各种仪器来采集、保存数据这些事情;最近需要做一个OCR文字识别的自动测试,之前基本没有接触过图像处理的相关概念,对于纯数学上的算法目前也只是大致在看。
       我需要识别的图片情况如下,准备是要用Labview 的VISION模块完成的,现在遇到了一些问题。
原图:

TEST1.jpg

手动ROI之后的灰度图:

A2.jpg


1,图像应该做一些哪些预处理的工作:我下面的许多问题是否是因为我预处理没有做好?
2,文字区域的提取和文字行的提取应如何进行:如何从整幅图像中确定文字区域?文字行应该如何分割?
3,字符的分割:实际操作中,我用Labview的read Text进行试验时,

QQ图片20150504102051.png

第一行的“1”和“0”基本分不开,其实后面的“6”和“5”也经常分不开,控件Read Text对于字符分割的识别是有一些参数配置的,所以用Labview VISION Assistant进行参数的修改设置,依旧不能把“1”和“0”分开,因为这两个数字实际上甚至是接触在一起的。我试过腐蚀、膨胀等处理,似乎没有什么作用。
       我比较好奇控件Read Text进行OCR的算法原理,但是NI的技术支持(上海的)表示他们也不知道,我是否应该写一个自己算法而不是采用控件Read Text?
4,用来学习的样本应该是灰度图还是二值图?

不知论坛里有没有有一定OCR项目经验的工程师是否可以指导下,谢谢!


友情提示: 此问题已得到解决,问题已经关闭,关闭后问题禁止继续编辑,回答。
10条回答
dlutccj
2019-07-18 21:35
uiaxiaobo 发表于 2015-5-5 10:19
谢谢,你的意思是做下二值化或者轮廓跟踪,接着就能分离出来了是吗?

之所以识别不出来就是对比度不明显吧,只是提供一种想法,不敢保证能识别出来

一周热门 更多>