Autor Beitrag
O'rallY
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 563



BeitragVerfasst: Di 05.11.02 20:52 
Ein Hash ist ja dazu da, Veränderungen an einer Datei festzustellen, doch wieviele verschiedene Möglichkeiten gibt es beispielsweise bei einem 128 Bit Hash. Es gibt auf jedenfall nicht genug, um jeder X-belibigen Datei einen eigenen einmaligen Hash zuzuweisen, also ist es doch rein theoretisch auch möglich, dass zwei verschiedenen Dateien den gleichen Hashwert aufweisen.
Oder irre ich?

_________________
.oO'rallY
Linux is like a tipi: No gates, no windows and a gnu-eating apache inside...
patrick
ontopic starontopic starontopic starontopic starontopic starofftopic starofftopic starofftopic star
Beiträge: 1481

WIN2k, WIN XP
D6 Personal, D2005 PE
BeitragVerfasst: Di 05.11.02 21:11 
dieser topic ist ohne garatie wenn ich stuss erzähle korrigir mich aber:
die warscheinlichkeit, das der selbe controlcode bei unterschiedlichen texten bei einem 128bit hash auftritt ist so gut wie 0 (ok vieleich 0,0000000000002) :D

soweit ich weiß setzt sich her hash ja (zumindest zum teil) aus dem enthaltenen text zusammen :?:

_________________
Patrick
im zweifelsfall immer das richtige tun!!!
O'rallY Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 563



BeitragVerfasst: Mi 06.11.02 18:06 
Es besteht trotzallem eine Wahrscheinlichkeit, bei unterschiedlichem Input die gleiche Ausgabe zu erhalten. Ok, ich habe keine Lust jetzt auszuprobieren, welche Datei nun den gleichen Hash hat wie eine andere :wink: .
Es gibt ja rein theoretisch unendlich viele Dateien. Natürlich sind da immer noch physische Grenzen, die nicht überschritten werden können. Aber es gibt nicht unendlich viele Hashes.

P.S.: Wie rechnet man eigentlich aus, wieviele verschiedene Möglichkeiten es bei einer bei einer 4-ziffrigen Ziffernfolge gibt? Also 0001, 0002, ... ,9001, usw. . Wie lautet die Formel?

_________________
.oO'rallY
Linux is like a tipi: No gates, no windows and a gnu-eating apache inside...
patrick
ontopic starontopic starontopic starontopic starontopic starofftopic starofftopic starofftopic star
Beiträge: 1481

WIN2k, WIN XP
D6 Personal, D2005 PE
BeitragVerfasst: Mi 06.11.02 20:21 
ich glaub
2 hoch stellenanzahl

_________________
Patrick
im zweifelsfall immer das richtige tun!!!
Udontknow
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 2596

Win7
D2006 WIN32, .NET (C#)
BeitragVerfasst: Do 07.11.02 11:52 
Hiho!

Zitat:
Wie rechnet man eigentlich aus, wieviele verschiedene Möglichkeiten es bei einer bei einer 4-ziffrigen Ziffernfolge gibt?


Basis^Stellen, wobei die Basis im dezimalen System eben 10 ist, im dualen bzw. binären 2. Bei 4 Stellen gibt es also 10^4=10000 Varianten (0000-9999).

Natürlich hast du recht, wenn du sagst, daß Hashes nicht eindeutig sind. Können sie ja schon aufgrund der oben genannten Rechenregel gar nicht.
Wenn ein Hash sich aus n Bit zusammensetzt, so gibt es 2^n mögliche Hashes. Eine nur um ein Bit grössere Datenmenge besitzt aber 2^(n+1) Varianten, da aber grundsätzlich jeder Datenmenge ein Hash zugeordnet ist (bzw. für jede DM ein Hash errechnet wird), muss es mehrere Datenmengen mit demselben Hash geben.

Grundsätzlich gilt, dass du die 100%ige Richtigkeit deiner Daten nur dann kontrollieren kannst, wenn du sie vollständig vergleichst. Jedes Prüfsummenverfahren kann fehlschlagen.
Allerdings ist es z.B. bei dem MD5-Hash äusserst(!) unwahrscheinlich, daß z.B. bei einer fehlerhaften Datenübertragung der Hash der nun veränderten Datenmenge noch immer derselbe ist. Auch nur ein geändertes Bit am Ende der Datenmenge gibt dir ja einen völlig anderen Hash zurück.

Cu,
Udontknow
O'rallY Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 563



BeitragVerfasst: Do 07.11.02 20:42 
Ja, es müsste schon ein verdammter Zufall sein, den gleichen Hash zu bekommen. Und ich werde natürlich auch weiterhin Hashes benutzen, mir ging nur der Gedanke durch den Kopf, wie es für jede Datei einen eindeutigen Hash geben sollte.
Aber wie schon gesagt, für den praktischen Gebrauch ist ein Hash wahrscheinlich vollkommen ausreichen! Vorallem ist es wohl noch unwahrscheinlicher, dass man zwei unterschiedliche Dateien hat, die beide etwas sinnvolles ergeben. Also kann man das wohl nicht für "böse Zwecke" wie Viren u. Co. verwenden

_________________
.oO'rallY
Linux is like a tipi: No gates, no windows and a gnu-eating apache inside...