‘검색엔진스패밍 (Search Engine Spamming)’이란 용어는 검색엔진으로부터의 트래픽을 늘리기 위한 다양한 기법들 중에서 지나치게 공격적인 기법들을 총체적으로 부르는 말이다.
※ 유인 키워드 반복 (Keyword Stuffing)
웹페이지의 연관도를 높이기 위해 같은 단어를 반복적으로 사용하는 것을 말한다.
웹페이지 구석에 다음과 같이 배치하는 것이 예가 될 수 있다.
돈벌기 돈벌기 돈벌기 돈벌기 돈벌기 돈벌기
돈벌기 돈벌기 돈벌기 돈벌기 돈벌기 돈벌기
돈벌기 돈벌기 돈벌기 돈벌기 돈벌기 돈벌기
검색엔진들은 이런 기법은 쉽게 감지한다. 심지어 어떤 검색엔진은 정상적인 관련 문서와 비교하여 한 단어가 정상적인 노출 빈도를 보이는가를 판단하기도 하며, 점차 정교해지는 ‘유인 키워드 배치’에 효과적으로 대응하고 있다.
※ 키워드 숨겨놓기 (Invisible Text)
유 인키워드 반복은 쉽게 발견되기 때문에, 이를 피하기 위해 웹페이지의 배경 색과 글자 색을 같게 하여 키워드를 배치하는 기법을 이용하는 이들도 있다. 이렇게 하면 웹페이지 상에서 일반 사용자의 눈에는 보이지 않게 된다. 그러나, 현재 많은 검색엔진들에서는 이 기법이 통하지 않는다.
※ 작은 글꼴 사용 (Tiny Text)
유인키워드 반복을 숨기기 위해서 많이 활용되는 또 하나의 방법이 작은 글꼴을 사용하는 것이다. 이 때문에 검색엔진에 따라서는 작은 글꼴이 과다하게 사용된 페이지를 검색 대상에서 제외하기도 한다. 그러므로, 기본 크기 이외의 글꼴을 웹페이지 내에서 필요 이상으로 사용하는 것은 피해야 한다. 필자는 이러한 웹페이지들이 검색엔진에서 검색 결과에 포함되지 않다가 보통 크기로 글꼴을 바꾼 후에는 정상적으로 검색 결과에 나오는 사례들을 보아왔다. 물론 작은 글씨를 절대 쓰면 안 된다는 의미는 아니다. 웹페이지 전체를 정상보다 작은 크기의 글꼴로 구성하는 것만은 피하는 게 좋다는 것이다.
※ 페이지 속이기(Page Spoofing) / 메타 리프레시 / 리다이렉션
메타 리프레시 태그를 사용하면 한 웹페이지를 방문한 사람들을 자동으로 새로운 페이지로 이동하게 만들 수 있다. 이런 방법을 사용하는 사람들은 미리 특정 키워드로 웹페이지를 검색결과에 잘 노출되도록 최적화시켜 놓은 후, 검색결과로부터 이 페이지를 클릭하기만 하면 준비된 다른 페이지로 연결되게 만들어 놓는다. 물론 이렇게 연결된 페이지들은 대개 원래의 검색 키워드와는 거의 연관성이 없는 내용들이 대부분이다. 이렇게 메타 리프레시 태그를 악용하는 것을 방지하기 위해, 검색엔진들은 리프레시 주기가 너무 짧게 설정된 페이지들은 검색대상에서 제외시킨다. 리프레시 주기가 너무 짧다는 것이 구체적으로 몇 초라는 것에 대해서는 명확한 가이드라인이 나와 있지는 않지만, 필자는 최소한 10초 정도면 안전할 것이라고 본다. 그러나, 어떤 검색엔진들은 리프레시 주기와 상관없이 메타 리프레시 태그가 포함된 페이지들은 제외하는 것을 원칙으로 하는 곳도 있다. 검색엔진들은 또한 리다이렉션을 시키는 자바스크립트를 포함한 페이지를 제외시키기도 한다. 정당한 사유로 리다이렉션을 해야 하는 경우에는 서버측(server-side) 리다이렉션을 사용하면 검색엔진에서 제외되지 않는다.
※ 메타 태그 반복 (Meta Tag Stuffing)
메 타 태그는 웹페이지에 키워드 정보를 추가할 수 있는 유용하면서도 적법한 방법이다. 그러나 이를 악용하는 사람들은 실제 페이지 내용과 전혀 관련이 없는 단어들을 메타 태그 내에 포함시키기도 한다. 이 기법의 예로, 한 성인사이트에서 세금 신고 기간을 이용해서 이 기간에 국세청 정보를 찾는 사람들을 유인하기 위해, 국세청과 관련된 키워드를 메타 태그 내에 사용했던 사례가 있다.
※ 페이지 반복(Page Stuffing) / 중복 페이지(Duplicate Pages)
동 일한 페이지를 중복하여 사용하거나 내용을 약간만 바꾸어서 여러 페이지로 만들어서 검색엔진에 수집되도록 하는 경우가 있다. 이 경우에는 그 페이지가 특정 키워드에 대해 검색엔진에 최적화되어 있다면, 중복 및 유사 페이지들까지 모두 해당 키워드 검색결과 페이지를 도배해 버리게 된다. 일반적으로 검색엔진들은 중복페이지를 제거하고 있으며, 지나친 페이지의 중복 저장을 감시하고 있다.
※ 타이틀 태그 중복 (Multiple Title Tags)
1997 년 초에는 웹페이지 내에 타이틀 태그를 여러 번 삽입하는 것이 가능했었고, 실제 그러한 방식이 유행하기도 했다. 인터넷 사용자 입장에서 브라우저로 웹페이지를 볼 때에는 아무 차이가 없지만 몇몇 검색엔진에서는 이 기법을 걸러내지 못했기 때문이다. 그러나, 현재는 이 방법이 통하는 검색엔진들은 거의 없다.
※ 코드 바꿔치기 / 클로킹 (Code Swapping/Cloaking)
어 떤 이들은 한 웹페이지를 검색엔진에 최적화시켜 상위 노출이 된 것을 확인한 후, 원래의 코드를 바꿔버리기도 한다. 이렇게 하는 이유는 그 페이지가 어떻게 상위 노출될 수 있었는지를 다른 사람이 알아낼 수 없도록 하기 위함이다. 검색엔진들은 일정한 간격을 두고 웹사이트를 다시 방문하여 페이지 정보를 수집해서 이러한 코드의 변경이 있는지를 검토하고 있다. 검색엔진이 언제 다시 방문할지는 모르는 일이므로 이렇게 코드를 바꿔버리는 것은 노출 순위 유지에 매우 위험한 일이며, 굳이 검색엔진이 아니더라도 경쟁사나 다른 이용자에 의해서 이러한 코드 변경은 쉽게 들통날 수 있다. 코드 변경보다 조금 더 진보된 방법으로 페이지 클로킹*을 사용하기도 하는데, 검색엔진에 따라서는 이런 것도 스팸으로 간주하기도 한다.
※ 도메인 스패밍 / 미러 사이트
다 른 도메인 이름을 사용하면서 웹사이트 내용은 완전히 같은 사이트를 미러 사이트라고 한다. 정당한 사유가 있어서 이를 사용하는 경우 이외에, 단순히 검색엔진으로부터 트래픽을 늘리기 위한 목적으로 미러 사이트를 이용하는 것도 보통 스팸으로 간주된다. 검색엔진이 미러 사이트임을 확인하게 되면 검색엔진 내의 해당 페이지 정보를 모두 삭제할 수도 있다.