Entwickler-Ecke

IO, XML und Registry - PDF als Text lesen


blumione - Di 23.12.08 13:58
Titel: PDF als Text lesen
Hallo zusammen

Wie kann man eine PDF-Datei als Text einlesen?

Ich möchte da Titel, Text, Fusszeilen, Notes, Literaturverzeichnis herausfiltern.
Mein Problem: Ich habe PDF Dateien und muss da jeden Monat einzelne Bereiche herauskopieren. Leider hat solch ein Dokument um die 300 Seiten und es ist immer eine riesen Arbeit.

Mfg
blumione


Kha - Di 23.12.08 14:14

Ohne eine spezielle PDF-Library wirst du da wohl nicht drankommen. Die bekannteste dürfte iTextSharp [http://itextsharp.sourceforge.net/] sein.