文字识别:如何现一个类似于ocr的程序
我现在想在unix下,用c实现一个类似于ocr的程序。就是提取gif或者jpg格式的图片上的文字。
因为第一次接触这方面,所以现在一头雾水,大家有什么思路,给我一些提示,谢谢。
比如:函数库(我现在就知道个opencv)、算法(我现在就知道神经元网络)等等。
最好能给我一个完整的实现过程,及每一过实现方法,不需要给出代码。
比如:预处理
特征提取
算法实现
图形对比
谢谢各位了。
[解决办法]
模式识别得有模式才行
你知道文字都是什么字体么?
[解决办法]
找个图像库能读取图片中数据,获得rgb值,剩下的怎么分割处理等,去看计算机图形学和模式识别的书啦
[解决办法]
那你得把常用的字体的各种大小(字体支持的所有大小)和变体(粗体、斜体、粗斜体)拿来训练识别引擎。
[解决办法]
matlab没有这样的功能
自己写一个可能迟了,买一个abbyy这样的引擎吧。