Combatiendo los mensajes de Spam que vienen con archivos PDF adjuntos.

En recientes días se ha sucitado una tormenta de Spam caracterizada por utilizar archivos adjuntos en PDF. Afortunadamente ha surgido una forma de combatir este problema. PDFassassin es un módulo para SpamAssassin que permite la revisión de los archivos PDF a través de text2pdf (poppler-utils o xpdf) y gocr. El módulo trabaja de la siguiente forma:
  1. Los cuerpos de los mensajes de correo electrónico son supervisados durante la conección y los adjuntos en PDF son revisados.
  2. Se extrae el texto desde los PDF a través de pdf2text y éste es supervisado por SpamAssassin
  3. Si el PDF contiene imágenes, se utiliza gocr para extraer el texto contenido en éstas.
  4. El total de calificación de Spam de el PDf es comparado contra el límite global especificado en required_score en el archivo pdf.cf; si éste es mayor, se suma a la calificación global del mensaje.
Instalación a continuación.
  1. Instalar poppler-utils
    yum -y install poppler-utils

  2. Instalar gocr (no incluido en CentOS 5 ni Red Hat Enterprise Linux 5, pero si en AL Desktop)
    yum -y install gocr

    O bien:
    wget http://www.alcancelibre.org/al/el/5/RPMS.al/gocr-0.44-2.9.el5.al.i386.rpm
    yum -y localinstall gocr-0.44-2.9.el5.al.i386.rpm
  3. Descargar el módulo desde http://blog.atmail.com/?p=61
    wget http://atmail.com/members/Pdf.tgz

  4. Descomprimir en /etc/mail/spamassassin/:
    tar zxvf Pdf.tgz -C  /etc/mail/spamassassin/ 

  5. Ajustar la configuración de SpamAssassin:
    spamassassin -D --lint 

  6. La salida (que mostrará mucha información) deberá incluir lo siguiente:
    dbg: config: read file /etc/mail/spamassassin/pdf.cf
    dbg: plugin: fixed relative path: /etc/mail/spamassassin/Pdf.pm
    dbg: plugin: loading Pdf from /etc/mail/spamassassin/Pdf.pm
    dbg: plugin: registered Pdf=HASH(0x93c2c40)

Tras lo anterior, solo bastará reiniciar los servicios de spamassassin y spamass-milter.

service spamassassin restart
service spamass-milter restart

Comentarios (0)


Alcance Libre
http://www.alcancelibre.org/article.php/comabit-spam-con-pdfassassin