DNS-Algorithmus gegen Spam

Dieses Thema im Forum "Ihre Meinung zu Artikeln auf pcwelt.de" wurde erstellt von Nevok, 23. August 2004.

Status des Themas:
Es sind keine weiteren Antworten möglich.
  1. Nevok

    Nevok Ganzes Gigabyte

    Registriert seit:
    3. Oktober 2002
    Beiträge:
    12.196
    Ein IBM-Algorithmus zur Mustersuche in DNS-Sequenzen erkennt auch Spam. Treffergenauigkeit: 97 Prozent.

    Den Teiresias-Algorithmus hatten IBM-Forscher ursprünglich entwickelt, um DNS-Stränge und Aminosäuren nach wiederkehrenden Mustern zu durchsuchen. Mit etwas Tuning haben Wissenschaftler am New Yorker Thomas J. Watson Research Center den DNA-Durchsucher jetzt zum Spam-Spürhund umkonfiguriert. Der in "Chung-Kwei" umbenannte Algorithmus wurde mit 65 000 Spam-Nachrichten gefüttert, die er dann mit normalen Mails verglich, um die in beiden Gruppen vorkommenden Muster auszusieben.

    Den Forschern zufolge weist der Filter eine Trefferquote von 96,56 Prozent auf und ordnete dabei nur eine von 6000 Nachrichten fälschlicherweise als Spam ein. Auf einem Pentium 4 mit 2,2 GHz verarbeitete Chung-Kwei laut Isidore Rigoutsos und Tien Huynh pro Sekunde 214 Nachrichten. In Werbe-Mails häufig vorkommende Zeichen-Ersetzungen wie V!agra und $ex berücksichtigt der Suchalgorithmus durch dieselben Routinen, nach denen Teiresias einander ähnliche DNS-Sequenzen wiedererkannte. Details zum Vorgehen des Filters finden sich in der detaillierten Beschreibung [PDF-Link]. Mittelfristig plant IBM, den Mechanismus auch in seinen Spam-Filter SpamGuru zu integrieren, der Bestandteil der nächsten Version von Lotus Workplace Messaging werden soll.

    Quelle
     
Status des Themas:
Es sind keine weiteren Antworten möglich.

Diese Seite empfehlen