Autor Beitrag
alzaimar
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 2889
Erhaltene Danke: 13

W2000, XP
D6E, BDS2006A, DevExpress
BeitragVerfasst: So 17.02.08 11:40 
user profile icontommie-lie hat folgendes geschrieben:
...Beispielsweise kann man bei einer HMTL-Seite bestimmte Teile der Nachricht, ...

Dazu muss er doch trotzdem den Inhalt verstehen ('Ah, is ne HTML-Seite'). Für mich ist das kein Widerspruch zu meiner Behauptung. Wir suchen ja keinen PKA für HTML-Seiten, sondern fragen uns, ob es eine Black-Box gibt, die jeden Text immer optimal komprimiert. Und da behaupte ich immer noch, das das ohne Wissen um den Inhalt nicht gehen kann (Beispiel mit den Lampen).

user profile icontommie-lie hat folgendes geschrieben:
alzaimar hat folgendes geschrieben:
Man kann z.B. ein Bild sehr gut komprimieren, in dem man genau erklärt, was auf ihm zu sehen ist.
Nein, das ist verlustbehaftete Kompression.

Wenn für Dich ein Bild nur aus Pixeln besteht, ja. Aber das meinte ich nicht, denn das das verlustbehaftet ist, ist mir klar, denn sonst hätte ich JPG statt GIF geschrieben. Es geht ja um Information. Und ein Bild hat ja auch einen Inhalt und wenn ich den genau beschreibe (Betonung auf 'genau') kann ich das Bild originalgetrei wieder herstellen. Vorausgesetzt natürlich, wir definieren 'Inhalt eines Bildes' nicht als Summe aller Pixel, sondern eben als das, was man sieht. Was ich meine ist der Kontext, vor dem die Komprimierung stattfindet. In der IT wird eine verlustfreie Kompression derzeit immer so definiert, das kein einziges Bit bei der Kompression/Dekompression verloren geht. Ist das nötig? Wenn ich z.B. Programmcode komprimiere, und mache das so, das ich einfach die Verfahren aufzähle ('.. und dann werden die Daten per Hashing gemappt...'), dann kann ich einen Programmcode sehr effektiv komprimieren, und den Code so wieder erstellen, daß er genauso funktioniert. Ok, Leerzeilen, Bemerkungen (wenn ich sie als redundant deklariert habe) sind flöten, und vielleicht sind auch Variablennamen anders, aber es ist im Sinne der E/A-Relation genau das gleiche Programm.

user profile icontommie-lie hat folgendes geschrieben:
Selbst wenn ich der beste Maler und du der beste Beschreiber von Bildern, du könntest mir nicht ein Bild so beschreiben, daß ich es malen kann und mein Gemälde exakt so aussieht, wie das Originalbild, es sei denn deine Beschreibung ist mindestens so umfangreich wie das Bild selbst.

Entschuldige, aber das ist haltloser Quatsch. Jeder Kompressor beschreibt die Information mit anderen Worten und die Beschreibung (der komprimierte Text) ist doch nun wirklich wesentlich kürzer als das Original.
user profile icontommie-lie hat folgendes geschrieben:
Stell dir einen Baum vor, du müsstest mir sagen wieviele Blätter er hat, ....

Du argumentierst so, also ob das, was Du dir nicht vorstellen kannst, nicht existiert. Wie gesagt, ZIP/LHA etc. machen's vor. Wir haben nur noch keine adäquate kompakte Beschreibungssprache für Bilder gefunden, die den Inhalt beschreibt. Weil Du dir das nicht vorstellen kannst, heißt das dann, das es soetwas nicht gibt? ;) .

Ich kann einen ganzen Film informationstechnisch so eindampfen (und ich kann jedes Pixel wieder herstellen ), indem ich den Film mit anderen Worten beschreibe, also nicht als Folge von Bildern und jedes Bild als Folge von Pixeln, sondern eben als Veränderungen der einzelnen Bilder. Auch hier wirst Du als Maler aus meiner Beschreibung den Film wieder 1:1 herstellen können, obwohl meine Beschreibung viel kompakter ist, als der ursprüngliche Film

Wie Du siehst, ist Kompression also nichts Anderes, als die Beschreibung einer Information in einer anderen Sprache. 'Beschreibung' impliziert 'Wissen um des Inhaltes'. Die klassischen KA, also LZH, ZIP etc. beschreiben den Text, indem sie ihn als 'Folge von Bytes' interpretieren. Kompressoren, die wissen, das es sich um einen englischen Text handelt, können viel effektiver komprimieren etc.

_________________
Na denn, dann. Bis dann, denn.
tommie-lie
ontopic starontopic starontopic starontopic starontopic starofftopic starofftopic starofftopic star
Beiträge: 4373

Ubuntu 7.10 "Gutsy Gibbon"

BeitragVerfasst: So 17.02.08 15:09 
user profile iconalzaimar hat folgendes geschrieben:
Dazu muss er doch trotzdem den Inhalt verstehen ('Ah, is ne HTML-Seite'). Für mich ist das kein Widerspruch zu meiner Behauptung. Wir suchen ja keinen PKA für HTML-Seiten, sondern fragen uns, ob es eine Black-Box gibt, die jeden Text immer optimal komprimiert. Und da behaupte ich immer noch, das das ohne Wissen um den Inhalt nicht gehen kann (Beispiel mit den Lampen).
Ich behaupte, daß ein solcher Algorithmus zmindest denkbar wäre, aber daß man eben mit spezialisierten Algorithmen, die über den Aufbau der Nachricht bescheid wissen, noch stärker komprimieren kann, man dann aber streng genommen den Algorithmus selbst zur Größe der Nachricht hinzurechnen müsste, weil in diesem die Information über den Aufbau steckt.
Ein General-Purpose-Algorithmus würde also die Nachricht so weit eindampfen, daß aus der komprimierten Nachricht immer noch hervorgeht, daß es sich um eine Nachricht mit bestimmter Syntax und bestimmten festen Konstrukten handelt. Ein spezialisierter Algorithmus kann auch diese Information noch entfernen und somit die Nachricht weiter verkleinern.

alzaimar hat folgendes geschrieben:
Wenn für Dich ein Bild nur aus Pixeln besteht, ja. Aber das meinte ich nicht, denn das das verlustbehaftet ist, ist mir klar, denn sonst hätte ich JPG statt GIF geschrieben. Es geht ja um Information. Und ein Bild hat ja auch einen Inhalt und wenn ich den genau beschreibe (Betonung auf 'genau') kann ich das Bild originalgetrei wieder herstellen. Vorausgesetzt natürlich, wir definieren 'Inhalt eines Bildes' nicht als Summe aller Pixel, sondern eben als das, was man sieht.
Ok, für mich wäre an dieser Stelle die Anzahl der Blätter des Baumes eine Information, die im ursprünglichen Bild enthalten ist, die ich also allein durch das Anschauen des Originalbildes bestimmen kann. Wenn für dich die wichtige Information "Baum auf Wiese" ist, dann ist das natürlich sehr viel weniger, als meiner Meinung nach im ursprünglichen Bild enthalten war. Daß "Baum auf Wiese" auch kürzer ist, als eine (in meinem Sinne) vollständige Beschreibung des Bildes, ist dann ebenfalls klar.

alzaimar hat folgendes geschrieben:
Wenn ich z.B. Programmcode komprimiere, und mache das so, das ich einfach die Verfahren aufzähle ('.. und dann werden die Daten per Hashing gemappt...'), dann kann ich einen Programmcode sehr effektiv komprimieren, und den Code so wieder erstellen, daß er genauso funktioniert.
Ja, man erhält wieder einen ähnlichen Code, der den gleichen Zweck erfüllt. Aber besonders für uns als Programmierer hat doch der Code noch mehr Eigenschaften als nur den reinen Algorithmus. Wenn du extrem ekligen Code hast, ihn auf diese Weise beschreibst und anschließend rekonstruierst, wird dein Code vermutlich einen ganz anderen Ekligkeitsfaktor haben, als der ursprüngliche Code. Informationen über den Kenntnisstand des Entwicklers sind insofern ebenfalls Teil des Codes (übrigens kann auch in einem Bild eine emotionale Nachricht enthalten sein, die der Maler dort ganz bewusst untergebracht hat, und die man bei einer Komprimierung ja möglichst ebenfalls erhalten möchte).


alzaimar hat folgendes geschrieben:
user profile icontommie-lie hat folgendes geschrieben:
Selbst wenn ich der beste Maler und du der beste Beschreiber von Bildern, du könntest mir nicht ein Bild so beschreiben, daß ich es malen kann und mein Gemälde exakt so aussieht, wie das Originalbild, es sei denn deine Beschreibung ist mindestens so umfangreich wie das Bild selbst.

Entschuldige, aber das ist haltloser Quatsch. Jeder Kompressor beschreibt die Information mit anderen Worten und die Beschreibung (der komprimierte Text) ist doch nun wirklich wesentlich kürzer als das Original.
Ich sagte umfangreich, das heißt die Menge an Informationen muss gleich sein. Eine Darstellung der Beschreibung kann dabei weniger Platz beanspruchen, als das Originalbild. Beispielsweise kann man die Beschreibung in eine Textdatei speichern und auf CD brennen, die wahrscheinlich kleiner sein wird, als die Leinwand, auf der das Originalbild war. Eine andere Darstellung der Beschreibung wäre, handschriftlich auf einen Bogen Papier zu schreiben, daß dieser dann kleiner ausfällt als die Leinwand, wage ich zu bezweifeln.
Genauso benötigt auch UTF-32 immer mindestens genauso viel Platz wie die Darstellung des gleichen Textes in UTF-8, jedoch ist der Informationsgehalt (der Text selbst) bei beiden Kodierungen der gleiche.

Vielleicht sollte ich als Zusatz auch noch erwähnen, daß, als ich die Analogie mit dem Bild suchte, Redundanzen im Bild vollständig ignorierte. Ein Himmel, der an jeder Stelle exakt die gleiche Farbe hat, lässt sich natürlich sehr viel kürzer beschreiben, als einer, der viele unterschiedliche Farbverläufe und Wolken hat.


alzaimar hat folgendes geschrieben:
Wie Du siehst, ist Kompression also nichts Anderes, als die Beschreibung einer Information in einer anderen Sprache.
Ja, man sucht die Kodierung, die die wenigste Redundanz enthält.

alzaimar hat folgendes geschrieben:
'Beschreibung' impliziert 'Wissen um des Inhaltes'. Die klassischen KA, also LZH, ZIP etc. beschreiben den Text, indem sie ihn als 'Folge von Bytes' interpretieren. Kompressoren, die wissen, das es sich um einen englischen Text handelt, können viel effektiver komprimieren etc.
Ja, das habe ich ja nie bezweifelt, aber ich bin der Meinung, daß man dann eben auch die Information, daß es sich um englischen Text handelt, ebenfalls zur komprimierten Nachricht rechnen müsste. Diese Information ist ja existent und ganz offenbar von absoluter Notwendigkeit, um mit der komprimierten Nachricht wieder die Originalnachricht zu erhalten.

_________________
Your computer is designed to become slower and more unreliable over time, so you have to upgrade. But if you'd like some false hope, I can tell you how to defragment your disk. - Dilbert
alzaimar
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 2889
Erhaltene Danke: 13

W2000, XP
D6E, BDS2006A, DevExpress
BeitragVerfasst: So 17.02.08 15:27 
user profile icontommie-lie hat folgendes geschrieben:

alzaimar hat folgendes geschrieben:
Wenn ich z.B. Programmcode komprimiere, ...
... Aber besonders für uns als Programmierer hat doch der Code noch mehr Eigenschaften als nur den reinen Algorithmus.

Nee, für mich nicht. Als Aufhänger zum Ärgern ja, aber ansonsten ist Stil und Nomenklatur für mich eben nicht notwendiger Bestandteil von Code.
user profile icontommie-lie hat folgendes geschrieben:
Wenn du extrem ekligen Code hast,

:motz: WIE? ICH UND ECKLIGEN CODE! DAS NIMMST DU SOFORT ZURÜCK :bawling: (woher weisst Du das überhaupt) :zwinker:
user profile icontommie-lie hat folgendes geschrieben:
... Informationen über den Kenntnisstand des Entwicklers sind insofern ebenfalls Teil des Codes (übrigens kann auch in einem Bild eine emotionale Nachricht enthalten sein, die der Maler dort ganz bewusst untergebracht hat, und die man bei einer Komprimierung ja möglichst ebenfalls erhalten möchte).

Wir reden aneinander vorbei. Ich rede nur von unterschiedlicher Auffassung von Information (neben dem Byte-für-Byte) und den damit möglichen unterschiedlichen Komprimierungen. Aber im Grunde genommen decken sich unsere Ansichten, denn
user profile icontommie-lie hat folgendes geschrieben:
... ist der Informationsgehalt (der Text selbst) bei beiden Kodierungen der gleiche.

user profile icontommie-lie hat folgendes geschrieben:
... man sucht die Kodierung, die die wenigste Redundanz enthält.


user profile icontommie-lie hat folgendes geschrieben:
...ich bin der Meinung, daß man dann eben auch die Information, daß es sich um englischen Text handelt, ebenfalls zur komprimierten Nachricht rechnen müsste. Diese Information ist ja existent und ganz offenbar von absoluter Notwendigkeit, um mit der komprimierten Nachricht wieder die Originalnachricht zu erhalten.

Genau, und so ein Kompressor/Dekompressor hätte die Vorraussetzungen, um immer optimal zu komprimieren. Leider scheitert das bisher an der fehlenden Möglichkeit, Semantik formal zu beschreiben.

_________________
Na denn, dann. Bis dann, denn.
tommie-lie
ontopic starontopic starontopic starontopic starontopic starofftopic starofftopic starofftopic star
Beiträge: 4373

Ubuntu 7.10 "Gutsy Gibbon"

BeitragVerfasst: So 17.02.08 19:07 
user profile iconalzaimar hat folgendes geschrieben:
Nee, für mich nicht. Als Aufhänger zum Ärgern ja, aber ansonsten ist Stil und Nomenklatur für mich eben nicht notwendiger Bestandteil von Code.
Naja, für mich ist das eben auch eine Information, die ih aus dem Code lesen kann.

alzaimar hat folgendes geschrieben:
Genau, und so ein Kompressor/Dekompressor hätte die Vorraussetzungen, um immer optimal zu komprimieren. Leider scheitert das bisher an der fehlenden Möglichkeit, Semantik formal zu beschreiben.
Jo, allerdings nur für Englische Texte. Setzt man ihm einen deutschen oder chinesischen Text vor, wird er wahrscheinlich nicht ganz so optimale Ergebnisse erzielen.
Wenn ein perfekter Algorithmus jede Nachricht optimal verkürzen soll, klappt das also nicht mit dem Verstecken der Informationen im Algorithmus selbst.

_________________
Your computer is designed to become slower and more unreliable over time, so you have to upgrade. But if you'd like some false hope, I can tell you how to defragment your disk. - Dilbert
Grenzgaenger
Ehemaliges Mitglied
Erhaltene Danke: 1



BeitragVerfasst: So 17.02.08 22:36 
user profile icontommie-lie hat folgendes geschrieben:
user profile iconGrenzgaenger hat folgendes geschrieben:
nicht ganz richtig, sondern die beschreibung muss mindestens so gut sein, wie du malen kannst ... ;-)
Dann würde man erst Recht nicht das Original erhalten, ist aber schon die Beschreibung nicht so umfangreich wie das Bild selbst, kann ich nicht das Original wiederherstellen, selbst wenn ich mindestens so gut malen könnte wie der Maler des Originalbildes.
kommt doch auch auf deine perspektive an... ob aus dem flugzeug, ob du auf dem boden stehst oder ob du mit dem elektronenmikroskop auf deinen baum/deine landschaft guckst... je nachdem brauchst du unterschiedliche informationen um dein bild hinzubekommen, so dass man es auch wieder erkennen kann.

von daher, hängt deine komprimierung auch immer von der semantik ab. denn IMHO hat nicht jeder mensch das auge eines elektronenmikroskops...