"Das muss doch gehen"
Nein. XML ist hinnreichend komplex, dass du es mit regexen nicht vollständig parsen kannst.
Ein bisschen parsen geht natürlich schon, aber das bringt's dann auch nicht so richtig...
Um deine Neugier zu stillen vielleicht noch so viel: Ein regex könnte z.B. so aussehen:
Zitat: |
<folder>\s*(\s+<(\w+)>([^<]*)</\2>\s)+</folder> |
Das Teil matcht dann immer direkt ein folder-Element und in den Gruppen müssten dann die Tags drin stehen. Aber whe jemand kommt auf die Idee, Attribute hinzuzufügen oder so... oder die Formatierung stimmt nicht. Oder ein Leerzeichen an der falschen Stelle. Ein CDATA Block. Ein leeres Tag.
Die ganzen Sachen, die deinen regex zu nichte machen, sollten dir aufzeigen dass es keine gute Idee ist
