<br clear="all">Hi,<br>Sorry for coming in so late, i came to know about Gsoc few days ago. <br>I am Undergraduate doing my Btech-Hons for IIIT - Hyderabad. I have worked in OCR, Vision,(Sfm) ,Image Processing,Information retreval.<br>
<br>I have worked before  with OCR(english). and would like to work with Bengali text too.<br>To achieve 98% accuracy we first need to find the bottle necks in the recognition process, which happens mainly in the reprocessing step. also to increase the accuracy i plan to use a dictionary look-up based post-process.<br>
Here is the basic overview of my idea.<br><br>A) preprocessing<br>       i) Image Acquisition and Binarization - (convert image to gray scale and then binarise using Otsu method). <br>      ii) Noise elimination - This is huge area in itself. There can be a lot of noises possible. Background noise can be removed with salt n pepper noise and connected  <br>
        component analysis.<br>     iii) Skew detection and correction - First we identified the upper envelope and then we applied Radon transform to the upper envelope to get the skew angle.<br>    iV) Line, word and character level segmentation- segment and isolate each character.( noise can add to splitting error).<br>
B)  Pattern Classification - pattern matching can itself be done in various ways- Template matching, Nural networks, HMMs, SVM. HMMs are known to have best accracy for <br>    char recognition. <br>    i) For the feature we can use vertically segmented char in DCT domain.<br>
C) Training for any of the classifiers we need a supervised training with a annotated dataset.<br>D) Post processing -  we can use spelling checker for correcting the erroneously recognized words with dictionary llokup.<br>
<br><br><br>-- <br>Sourav Dutta<br><div><div>CSE,UG3</div><div>IIIT H</div></div><br>