Autor Beitrag
computercrack
Hält's aus hier
Beiträge: 15



BeitragVerfasst: Do 16.08.07 09:47 
Ich habe ein kleines Problem:
Ich möchte ein automatisiertes System überwachen!
Also erster Vorschlag war einem Server ein Programm zu geben das immer überprüft, ob das automatisierte System erreichbar ist aber ich habe festgestellt wenn der Server nicht mehr funktioniert egal was kaputt ist, wird mein System nicht mehr überwacht.
Gibt es eine Möglichkeit das automatisierte System so zu überwachen das es kein Singlepoint of Failure gibt.
Also mein automatisches System soll überwacht werden mit einem Programm das sich quasi selbst überprüfen kann ob es läuft!
Gibt es sowas oder hat jemand eine Idee wie man das System sonst überprüfen kann?

MFG

Computercrack
jasocul
ontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic star
Beiträge: 6395
Erhaltene Danke: 149

Windows 7 + Windows 10
Sydney Prof + CE
BeitragVerfasst: Do 16.08.07 09:58 
Ein Programm, das nicht läuft, kann sich auch nicht prüfen.

Wie wäre es mit zwei Systemen, die sich gegenseitig und das System prüfen? Alternativ wären zwei Programme auf dem Server eine Notlösung. Allerdings darf dann kein Schaden an dem Server vorliegen. Das ist also nicht wirklich sicher.

Eine wirklich saubere Lösung ist also nur mit mindestens zwei völlig unabhängigen (auch Strom, etc.) Systemen möglich.
computercrack Threadstarter
Hält's aus hier
Beiträge: 15



BeitragVerfasst: Do 16.08.07 10:00 
Gibt es auch eine andere Möglichkeit als mit 2 voneinander ünabhängigen Servern
Reinhard Kern
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 591
Erhaltene Danke: 14



BeitragVerfasst: Do 16.08.07 10:03 
user profile iconcomputercrack hat folgendes geschrieben:
Gibt es auch eine andere Möglichkeit als mit 2 voneinander ünabhängigen Servern


Das Übliche ist der Einsatz einer Watchdog-Schaltung. Bei Industrie-PCs ist das oft schon vorgesehen.

Gruss Reinhard
computercrack Threadstarter
Hält's aus hier
Beiträge: 15



BeitragVerfasst: Do 16.08.07 10:07 
Was ist eine Watchdog-Schaltung ?

Gibt es auch noch eine weitere Lösung ?

MFG

Computercrack

Moderiert von user profile iconChristian S.: Beiträge zusammengefasst, bitte Edit-Funktion nutzen
Reinhard Kern
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 591
Erhaltene Danke: 14



BeitragVerfasst: Fr 17.08.07 01:18 
user profile iconcomputercrack hat folgendes geschrieben:
Was ist eine Watchdog-Schaltung ?

Gibt es auch noch eine weitere Lösung ?

MFG

Computercrack

Moderiert von user profile iconChristian S.: Beiträge zusammengefasst, bitte Edit-Funktion nutzen


Ein Watchdog (Wachhund) ist ein Hardwaretimer, der in regelmässigen Abständen einen Impuls erhalten muss, sonst löst er einen (Hardware!) Reset aus. Das ist bei einer nicht mehr antwortenden Software ja auch die einzige Möglichkeit eines Neustarts. Ein "Impuls" ist bei einem eingebauten Watchdog normalerweise ein Schreibbefehl an eine Portadresse (ein Treiber sollte mitgeliefert sein), bei einer Bastellösung kann man ein Pin einer seriellen oder parallelen Schnittstelle verwenden.

Um z.B. einen Server zu überwachen, kann man sich ein kleines Programm erstellen, das in einer endlosen Schleife den WWW-Server prüft, dann SQL usw. usw. und im Erfolgsfall aller Prüfungen dem Watchdog einen Impuls gibt. Fällt IRGENDETWAS aus, einschliesslich Prüfprogramm oder Betriebssystem, erzeugt der Watchdog einen Reset und startet den Server neu - brachial, aber die einzig sichere Methode für ein Einzelsystem. Softwarelösungen können das nicht.

Gruss Reinhard
Narses
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Administrator
Beiträge: 10183
Erhaltene Danke: 1256

W10ent
TP3 .. D7pro .. D10.2CE
BeitragVerfasst: Fr 17.08.07 10:43 
Moin!

user profile iconcomputercrack hat folgendes geschrieben:
Ich möchte ein automatisiertes System überwachen!
[...]
ich habe festgestellt wenn der Server nicht mehr funktioniert egal was kaputt ist, wird mein System nicht mehr überwacht.
Gibt es eine Möglichkeit das automatisierte System so zu überwachen das es kein Singlepoint of Failure gibt.
[...]
Gibt es sowas

Ich werfe mal etwas Theorie hier rein, nur "für die Beachtung aller Sicherheitsmaßnahmen" (das wäre doch mal was für den Filmzitate-Raten-Thread... :? :)):

Das ist das Turing-Problem, für das es letztlich keine Lösung gibt: man kann zwar beliebig viele Maschinen dazu verwenden, sich gegenseitig zu überwachen, aber es wird immer eine Situation möglich sein, in der "ein Toter Mann nicht mehr sagen kann, dass der tot ist"! :nixweiss: So ist das leider eben. :|

Auch der Watchdog ist nur ein Schritt in dieser Kette: wenn der Server, den er überwacht, kaputt ist (Hardwaredefekt), dann kriegt das auch wieder "keiner" mit. Oder der Watchdog selbst ist kaputt, was dann... :P

Einzige Lösung: ein Aussenstehender (also du als Mensch) mußt das Gesamtsystem überwachen, und nur du kannst sagen: "Es ist defekt!" :mahn: (klar, dass es nicht defekt ist, können die Maschinen auch feststellen, aber das ist ja idR "uninteressant")

Ansatz für eine halb-automatische Lösung: mach dich zum Watchdog ;) lass dir vom System in regelmäßigen Abständen eine Email schicken. Kriegst du keine mehr, ist es ausgefallen. Ist das System ausreichend wichtig, dann ist der Nervfaktor mit den Mails (oder einer anderen Form von Nachricht) durchaus akzeptabel. Ist es nicht soo wichtig, dann schraub das Intervall runter, eine oder zwei pro Tag (Dienstbeginn, Feierabend). :idea:

cu
Narses

_________________
There are 10 types of people - those who understand binary and those who don´t.
arj
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 378

Win XP/Vista, Debian, (K)Ubuntu
Delphi 5 Prof, Delphi 7 Prof, C# (#Develop, VS 2005), Java (Eclipse), C++, QT, PHP, Python
BeitragVerfasst: Fr 17.08.07 10:50 
Ich habe eine andere Lösung gefunden, wenn es nur darum gehen sollte, dass der Server läuft oder nicht, und der Server öffentlich ist:
Ich hab nen ICQ-Client installiert und seh somit in meiner Kontaktliste immer, ob der Server läuft ;)
Reinhard Kern
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 591
Erhaltene Danke: 14



BeitragVerfasst: Mo 20.08.07 01:51 
user profile iconNarses hat folgendes geschrieben:
Moin!


Auch der Watchdog ist nur ein Schritt in dieser Kette: wenn der Server, den er überwacht, kaputt ist (Hardwaredefekt), dann kriegt das auch wieder "keiner" mit. Oder der Watchdog selbst ist kaputt, was dann... :P

cu
Narses


Hallo Narses,

in letzter Konsequenz hat Turing wie immer recht. Man kann aber mit Redundanz schon viel erreichen - es GIBT Systeme, da kannst du mit der Feueraxt reinschlagen, und statt auszufallen, schicken Sie eine EMail an den Ersatzteil-Service, welche Austauschteile gebraucht werden. Die sind am Morgen danach um 7.00 da, bevor der Admin überhaupt weiss, dass jemand auf seinen Rechner losgegangen ist. Dass Hardware und Service für diese Art ausfallsicherer Prozessrechner geringfügig teurer sind als für ein Standard Pentium System, darf einen dabei nicht stören. Das Ganze erinnert mich an den HAL9000.

Das Watchdog-Konzept hat seine Grenze natürlich darin, dass man einen wirklich kaputten Rechner auch durch einen Restart nicht wieder zum Laufen bringt, aber das kriegt der Admin ja auch nicht hin, da ist erst mal die Reparaturabteilung gefragt. Ausserdem ist ein Watchdog sehr simpel und hat deshalb eine geringe Ausfallwahrscheinlichkeit. Mit dem Knowhow aus der Bahntechnik könnte man auch ultrazuverlässige Watchdogs bauen, wenn es sich lohnen würde.

Am wirtschaftlichsten ist wohl das Google-Prinzip: man nimmt z.B. 5000 parallel arbeitende Rechner in Betrieb, die Suchanfragen bearbeiten. Fällt einer aus, was solls, die Leistung sinkt dabei um 1/5000el. Macht sich das mal bemerkbar, hängt man halt nochmal 1000 dazu, die Mühe, defekte Rechner stillzulegen oder auszubauen, spart man sich gleich.

Gruss Reinhard