Autor Beitrag
cartridge
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 209

Win XP
D4 Prof,D6 Prof
BeitragVerfasst: Sa 23.04.05 21:13 
Hallo Leute!

Weiß jemand, wie man Text aus einer PDF- Datei extrahiert? Leider enthält diese Datei auch eine Tabelle, so dass nicht nur einfacher Text sich in der Datei befindet. Ich habe auch nicht verstanden, warum in einer einfachen PDF- Datei der Text in Klartext lesbar ist und in einer aufwändigeren nicht. Habe nur irgendwo gelesen, dass es sich bei dem Text in einer PDF_ Datei um Postscript handeln soll. Hilft mir aber auch nicht weiter...

Vielleicht hat ja jemand ne Kompo...

Gruß
Ingo
fvolk
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 203

Win XP (Home & Pro)
Delphi 2005 Pers
BeitragVerfasst: So 24.04.05 09:37 
Hier gibt es ein (externes) Programm, das Text aus PDFs extrahieren kann. Je nachdem, was du vorhast, kannst du entweder dieses in dein Programm einbinden oder die "große" PDFLib benutzen (die kann natürlich auch viel mehr, als du eigentlich brauchst).

_________________
Nichts auf der Welt ist so gerecht verteilt wie der Verstand. Denn jedermann ist überzeugt, dass er genug davon habe.
(René Descartes)
Silberwolf
ontopic starontopic starofftopic starofftopic starofftopic starofftopic starofftopic starofftopic star
Beiträge: 306

Win XP Home SP2
D5 Prof, D2k5 Pers
BeitragVerfasst: So 24.04.05 10:12 
Ich hatte mal so ein Plugin, aber habe leider vergessen wie es heißt, aber ich schau nochmal nach.
War irgendwo auf ner c't CD.

@fvolk:

Da in der Überschrift der Seite
Zitat:
CZ-Pdf2Txt Simple For Acrobat V1.1
steht, denke ich mal, es ist für den Reader 1.1, oder irre ich mich da :?:
Ich benutze den reader 7.0, aber ich habs nicht ausprobiert, es könnte auch funktionieren, versuchs halt...

_________________
Gestorben, aber nicht vergessen...
fvolk
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 203

Win XP (Home & Pro)
Delphi 2005 Pers
BeitragVerfasst: So 24.04.05 10:46 
@Silberwolf: Ich denke eher, dass es

Zitat:
CZ-Pdf2Txt Simple For Acrobat V1.1


heißt.

_________________
Nichts auf der Welt ist so gerecht verteilt wie der Verstand. Denn jedermann ist überzeugt, dass er genug davon habe.
(René Descartes)
Silberwolf
ontopic starontopic starofftopic starofftopic starofftopic starofftopic starofftopic starofftopic star
Beiträge: 306

Win XP Home SP2
D5 Prof, D2k5 Pers
BeitragVerfasst: So 24.04.05 11:10 
So kann man es auch sehen :D :wink:

_________________
Gestorben, aber nicht vergessen...
fvolk
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 203

Win XP (Home & Pro)
Delphi 2005 Pers
BeitragVerfasst: So 24.04.05 12:26 
Ja :lol: , war aber eines der genialsten Missverständnisse in der letzten Zeit.

_________________
Nichts auf der Welt ist so gerecht verteilt wie der Verstand. Denn jedermann ist überzeugt, dass er genug davon habe.
(René Descartes)