Ich wollte ein kleines OCR Programm schreiben das auf der Tesseract lib. besteht.
Ich mache ein Screen Shot von einem bestimmten Berreich. Den speicher ich als .tiff Bilddatei für Tesseract ab.
Soweit sogut.
SchreenShot: (Kein Problem funktioniert super)
C#-Quelltext
1: 2: 3: 4: 5: 6: 7: 8: 9: 10: 11: 12: 13: 14: 15: 16: 17: 18: 19: 20:
| private Bitmap CreateScreenshot(int left, int top, int width, int height) { try { Bitmap delete = new Bitmap("c:\\testpng.png"); delete.Dispose(); GC.Collect(); File.Delete("c:\\testpng.png"); } catch { } Bitmap bmp = new Bitmap(width, height); Graphics g = Graphics.FromImage(bmp); g.CopyFromScreen(left, top, 0, 0, new Size(width, height)); g.Dispose(); bmp.Save("c:\\testpng.png"); System.Drawing.Bitmap.FromFile("c:\\testpng.png").Save("c:\\test.tif", System.Drawing.Imaging.ImageFormat.Tiff); return bmp; } |
Scan: (Total für den *****)
C#-Quelltext
1: 2: 3: 4: 5: 6: 7: 8: 9:
| Bitmap scan = new Bitmap("eurotext.tif"); tessnet2.Tesseract ocr = new tessnet2.Tesseract(); ocr.SetVariable("tessedit_char_whitelist", "0123456789"); ocr.Init(@"c:\temp", "fra", false); List<tessnet2.Word> result = ocr.DoOCR(scan, Rectangle.Empty); foreach (tessnet2.Word word in result) { Console.WriteLine("{0} : {1}", word.Confidence, word.Text); } |
Die ausgabe bei Console.Writline erstmal ignorieren
Bekomme ständig fehlermeldungen mit fehlenden quellen.
Die Tesseract.dll hab ich hinzugefügt.
Aber es fehlen mir noch angeblich viele .h Dateien.