Entwickler-Ecke

Internet / Netzwerk - Homepages speichern


opfer.der.genauigkeit - Sa 26.10.02 12:56
Titel: Homepages speichern
Ich möchte gern Homepages speichern.
Am besten über n Popupmenü bei der man die Möglichkeit hat
nur die aktuelle Homepage zu speichern auf der man sich befindet oder
die gesamte Homepage zu speichern (also alle verknüpften teile).

Vielleicht hat da jemand schon Erfahrung... wär ne feine Sache.


Steffer - So 27.10.02 13:28

Nun, abgesehen davon, das es dazu fertige Software gibt, kannst du das wohl so regeln...

Homepage laden...
Alle Links auslesen ...
Dann diese Seiten laden.
Wieder alle Links auslesen...
usw.

Dazu eben noch die ganzen Grafiken, ev. .css usw.


opfer.der.genauigkeit - Mo 28.10.02 12:29

Hm... ja danke.
Aber eigentlich wollt ich das n bißchen genauer wissen.
Die Vorgehensweise ist mir klar, aber vielleicht kannst du mir ja
noch sagen welche Komponenten ich dafür brauche.
Den Rest kann ich ja versuchen selber rauszubekommen.


Udontknow - Mo 28.10.02 12:38

Hi!

Schnapp dir einfach mal die Indy-Http-Komponente. Mit der Methode Get kannst du dann einzelne Files aus dem Netz laden.
Wenn du die "ganze Homepage" speichern willst, wirst du übrigens auf ein Problem stossen: Welcher Link gehört noch zum HP-Inhalt, welcher führt von der HP fort? Das kannst du so gar nicht feststellen.

Cu,
Udontknow


opfer.der.genauigkeit - Mo 28.10.02 12:57

Jo, das mit der gesamten Homepage speichern wird noch ne interessante Sache. Aber danke für den Hinweis wegen der Kompo ich werds probieren.


Steffer - Mo 28.10.02 14:04

Zum speichern kannst du mehrere verwenden ...
Die Seite kannst du dir auch in den TWebbrowser laden und dann so die Links listen:
http://www.faqsen.de/find.jsp?FAQ=1;495648554850494951545350;2

>Welcher Link gehört noch zum HP-Inhalt, welcher führt von der HP fort?
>Das kannst du so gar nicht feststellen.
Jeder relative Link ist von der Homepage
Jeden absoluten Link must du mit deiner Start-URL vergleichen.
Dann hast du die Unterschiede.


Udontknow - Mo 28.10.02 14:30

@Steffer:
>Jeder relative Link ist von der Homepage
>Jeden absoluten Link must du mit deiner Start-URL vergleichen.
>Dann hast du die Unterschiede.

Das ist falsch. Es gibt sehr viele HPs, die ihre Inhalte über mehrere Domains bzw. Server verteilt haben. Ein Beispiel: Ein Forum, das umsonst von einem Dritten zur Verfügung gestellt wird, wird in einer HP eingebunden. Das Forum gehört inhaltlich natürlich zur HP, ist aber nicht auf demselben Rechner wie die HP!
Umgekehrt gibt es auch die Varianten, daß ein Link zwar ein relativer Link ist, dieser aber auf eine HP mit völlig anderer Thematik zeigt.

Cu,
Udontknow


Steffer - Mo 28.10.02 15:16

>Ein Beispiel: Ein Forum, das umsonst von einem Dritten zur Verfügung
>gestellt wird, wird in einer HP eingebunden. Das Forum gehört inhaltlich
>natürlich zur HP, ist aber nicht auf demselben Rechner wie die HP!

Stimmt.
Jedoch handelt es sich dabei auch um einen externen Link, also würde ich ihn ignorieren...


Udontknow - Mo 28.10.02 15:19

???

Aber das gehört doch zur eigentlichen HP? Ignorieren wäre doch falsch!


Steffer - Mo 28.10.02 16:28

>Aber das gehört doch zur eigentlichen HP? Ignorieren wäre doch falsch!

Nun, diese Daten wird kein Graber erreichen.
Z.B. Forum mit Login usw...
Da kannst du nur ignorieren.


Udontknow - Mo 28.10.02 16:59

Ganz davon abgesehen, dass das Forum nur ein Beispiel war, sind fast alle Foren (wie dieses) frei zugänglich, lediglich Schreiboperationen erfordern eine Authentifizierung.
Stell dir vor, das jemand Teile seiner HP aufgrund mangelndem Webspace auf dem T-Online-Account seines Kollegen gebunkert hat. Tjaaaa... :)

Spontan fallen mir nun so ein:
- Gästebücher
- Foren
- Ressourcen zum Thema (Downloads)
- lustiges Java-Viechs :wink:
- alles, was irgendwie über normales HTML hinausgeht

Cu,
Udontknow


opfer.der.genauigkeit - Mo 28.10.02 17:30

Leude bitte bringt euch nicht gegenseitig um.
Ich glaub ich weiß schon wie ich das mit dem runterladen etc. mache.
Und wenn ich ne vernünftige Idee hatte poste ich... ansonsten
werd ich euch fragen ob ihr mir das erklären könnt.
:lol:


Steffer - Mo 28.10.02 18:02

>Leude bitte bringt euch nicht gegenseitig um.
Bin ich weit davon entfernt .... :D

Die Argumente von Udontknow sind richtig. Hat imo nix mit "Mord" zu tun. Eher mit Gedankenaustausch.

Aber es gibt die Steffer's last words...

>Spontan fallen mir nun so ein:
>- Gästebücher
>- Foren
>- Ressourcen zum Thema (Downloads)
>- lustiges Java-Viechs
>- alles, was irgendwie über normales HTML hinausgeht

Das meiste davon ist dynamisch.
Bekommst du also eh nicht mit den Kompos in den Griff.

>- Ressourcen zum Thema (Downloads)
Darauf würde ich ganz verzichten, denn das kann ein Hammer werden...

>Ganz davon abgesehen, dass das Forum nur ein Beispiel war, sind fast
>alle Foren (wie dieses) frei zugänglich, lediglich Schreiboperationen
>erfordern eine Authentifizierung.
Nicht alle .. meine liegen z.B. ALLE in einem geschützten Bereich und laufen über Serversoftware.

>Stell dir vor, das jemand Teile seiner HP aufgrund mangelndem
>Webspace auf dem T-Online-Account seines Kollegen gebunkert hat.
>Tjaaaa...
Sch** HP, ignorieren :wink: