Entwickler-Ecke

Internet / Netzwerk - nicht existente HTML Tags filtern


Dusty - Do 26.06.03 11:21
Titel: nicht existente HTML Tags filtern
Spammer benutzen nicht existente HTML-Befehle, um die lesbarkeit ihrer Mail zu erschweren. Zum Beispiel:

Quelltext
1:
2:
3:
4:
5:
6:
7:
8:
9:
10:
<html><BODY>

Get la<Z>r<XZYO>g<XKMA>er nuts and <X>penís<KP>,  
   m<XJXL>ore
 <YEA>p<Z>leasure<XZBJ>, 
  <WE>m<CIUB>o<C>re
 <WHAR>s<YPEX>ati<ZSH>s<WZG>fa<W>ction<br>
<br>
 </body>    
</html>


==> ergibt: "Get larger nuts and penís, more pleasure, more satisfaction"

Wie lassen sich diese Befehle sinnvoll filtern? Kann Delphi das "von sich aus" oder muss das "in Handarbeit" aussortiert werden?


Dezipaitor - Do 26.06.03 12:31

naja,
ich habe sowieso HTML in der email betrachtung abgestellt.

aber wenn man soetwas durchführen will,
denke ich mal muss du den code schon selber durchgehen.

vorher sollte man aber natürlich eine liste von gültigen befehlen besitzen, die man mit den tags vergleichen kann.

wenn man dann 50 ungültige befehle hat, kann man mit großer sicherheit davon ausgehen, dass es eine spam ist.