Ich habe mich auch schon mal damit beschäftigt und möchte dir folgendes mitgeben: Zuerst musst du dir folgende Fragen stellen:
Können es mehrere Zeilen Schrift sein? -> Linien erkennen
Sind die Buchstaben getrennt? -> Wenn nicht, wird auch die Segmentation der Buchstaben ein Problem
Sind es Gross- und Kleinbuchstaben? Gibt es auch Zahlen, Sonderzeichen, Satzzeichen usw? -> Erkennung immer schwieriger...
Sind die Bilder farbig? -> Was gehört zum Hintergrund, was zum Geschriebenen?
Und noch einige mehr...
Du siehst, das sind alles Probleme, welche noch nicht mal mit der Erkennung zu tun haben. Ich meine, ich will dich nicht entmutigen, aber wie Klabautermann schon schrieb, ist es eine sehr schwierige Aufgabe. Du wärst überrascht, wie schlecht hier auch kommerzielle Programme abschneiden. Dieses Gebiet, genannt ICR (Intelligent Character Recognition), ist immer noch in Entwicklung...
Ich kann dir auch folgendes sagen: Das Programm, welches ich schrieb, las SW-Bilder mit nur einer Zeile Schrift, kein Hintergrund, Abstand zwischen den einzelnen Zeichen und die Linien sorgfältig gezogen...Resultat: 70% Erkennungsrate, wenn das Wort aus einer Wörterliste stammte. Wenn nicht.......
Aber ich wünsche dir natürlich trotzdem viel Spass. Ich finde, man lernt viel über Buchstaben (Ich weiss nun beispielsweise auswendig, welche Buchstaben eine Symmetrieachse haben

)...
Wenn du mal ein halbfertiges Programm hast, würd ichs mir gerne anschauen. Kannst mich auch im ICQ anquatschen.