Autor Beitrag
blumione
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starontopic star
Beiträge: 22



BeitragVerfasst: Di 23.12.08 13:58 
Hallo zusammen

Wie kann man eine PDF-Datei als Text einlesen?

Ich möchte da Titel, Text, Fusszeilen, Notes, Literaturverzeichnis herausfiltern.
Mein Problem: Ich habe PDF Dateien und muss da jeden Monat einzelne Bereiche herauskopieren. Leider hat solch ein Dokument um die 300 Seiten und es ist immer eine riesen Arbeit.

Mfg
blumione
Kha
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 3803
Erhaltene Danke: 176

Arch Linux
Python, C, C++ (vim)
BeitragVerfasst: Di 23.12.08 14:14 
Ohne eine spezielle PDF-Library wirst du da wohl nicht drankommen. Die bekannteste dürfte iTextSharp sein.

_________________
>λ=