스팸 메일

대학 동기들간 연락하는데 야후의 메일링 리스트 서비스를 이용하고 있었다. 한동안 아무 소식이 없길래 그런가보다 하고 있었는데, 알고보니, 내 계정으로 온 메일이 바운스되어서 메일링 리스트에서 아예 나한테 메일을 보내지 않고 있었다. 그걸 되살라려고 하니, 해당 주소로 메일링 리스트에서 confirmation 메일을 보내고, 내가 그걸 confirm해야 하는데, confirmation 메일이 우리 회사 스팸 필터에 걸려서 전달되지 않았다. 물론 첨부터 스팸필터 때문에 바운스되고 블럭된 것이었다. 어찌 어찌하여 이 문제는 해결하였지만, 동기들 중에 같은 문제로 소식이 전해지지 못한 친구들이 여럿 있었기에, 메일링 리스트에 보완적으로 RSS feed를 사용해보면 어떨까 생각해보았다. 야후 메일링 리스트도 내용을 공개하도록 하면 RSS feed가 생기는데, 테스트해보니 한글이 깨졌다. 구글의 메일링 리스트 서비스가 한글이 깨지지 않는 것 같아, 그걸로 바꿀까 했는데, 역시 가입을 confirm하는 메일이 필터링되어 가입하는 것부터 쉽지 않았다. 문제는 회사의 스팸 필터가 멍청할 뿐더러 쓰기 불편하게 되어 있다는 것인데, 회사 IT에 얘기는 해놓았으나 금새 해결될 것으로 기대하지 않는다. 외국에서 오는 메일에 대해선 필터의 성능이 엉망이어서, 받아야할 메일은 걸러버리면서 하도 많은 스팸 메일이 그냥 통과되고 있었기 때문에, 한 1년쯤 전부터 별도로 SpamBayes를 PC의 Outlook에 설치하여 사용해왔다. 이걸로 스팸 문제는 어느 정도 해결되었다고 생각하고 있었는데, 몇달전부터 점점 이미지 스팸이 늘어나기 시작했다. spam.JPG 이미지 스팸은 위와 같이 광고 전체를 이미지로 만들어서 Bayesian 필터와 같이 텍스트 내용에 의한 필터링을 피하는 것인데, 이걸 OCR (Optical Character Recognition)해서 필터링하는 것을 피하기 위해 아래와 같이 텍스트에 적당한 노이즈를 더하는 이미지 스팸들도 늘어나고 있다. spam1.gif 스팸이 아니면서도 이미지를 사용하는 메일들이 꽤 있기 때문에, 하긴 대부분의 그런 메일은 스팸까진 아니더라도 마케팅용 메일이 많아서 못받아도 별 탈은 없지만, 그래도 정확히 걸러 받으려면 OCR 기술이 진보해서 내용에 기반해서 필터링하는 것이 맞을 것 같다. 그런데 OCR 기술이 진보할수록 로봇에 의한 계정 자동 생성이나 덧글 작성을 막기위해 사용하고 있는 CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart) 가 무용지물이 되어 버린다 (아래 그림은 CAPTCHA의 예). captcha.jpg 로봇이 계정을 자동으로 만들거나 덧글을 작성하는 것도 스팸이 목적인 경우가 대부분이므로, 결국 스팸을 차단하기 위해 OCR 기술을 향상시키면 그게 다시 스패머들에 의해 이용될 수도 있게 된다. 컴퓨터와 네트웍이 계속 똑똑해지고 값싸지는 추세에서, 그런 기술들을 활용하여 자신들의 이기적인 목적을 달성하려는 사람들을 같은 기술을 사용해서 막아보자 하는 것이 결국 끝이 나질 않는 경쟁일까? 이글루스에서 덧글과 트랙백 스팸이 하도 심하여 워드프레스로 이전하여 Akismet 서비스를 이용하니 스팸을 거의 걱정하지 않아도 되게 되었지만, 얼마든지 남이 보고 검증해줘도 되는 블로그 덧글과 달리 회사의 메일을 일일이 외부로 보내 스팸 여부를 검증받을 수도 없고, 앞으로 뭔가 해결책이 나와야 하는 문제 중의 하나이다.