저품질 블로그?

국내 인터넷검색의 1위 네이버 검색엔진은 약 80% 가량을 점유하고 있다.

다양한 블로그 서비스중에 유독 네이버 블로그에만 있는 특이한 현상이 있다. 그건 바로 ‘저품질‘ 낙인이다.

네이버에서는 인정하지 않지만, 저품질 컨텐츠를 남발하는 블로그/사이트를 구별하여 일종의 낙인을 찍어놓고 검색결과에서 배제하는 알고리즘을 사용하고 있다. 1)

네이버 로직의 종류와 뜻 네이버 검색엔진은 지속적으로 변경이 되면서 진화하고 있다.

  1. 옛날 – 네이버 검색엔진 초보시절 작업을 하면 하는대로 상위노출이었음. (이 시기때 누가 작업한 사람이 있었을까 한다.)
  2. 청크시스템(2009) – 중복문서 판독 시스템 도입, 블로그 지수를 점수로 파악하기 시작
  3. 시퀀스검색(2010) – 옛날 네이트의 시맨틱검색 기억 하시나요? 이 시맨틱검색의 대항마로 내놓았다. 지식인 기반으로 운영이 되었고, 지식인이 사람이 관리하기 시작
  4. 엘러펀트프로젝트(2011) – 문맥에 맞는 글을 검사한다고 선언, 컨텐츠 신뢰 확보를 위해 체류시간페이지뷰를 체크하기 시작
  5. 리브라 로직(2012) – 감시꾼이 많아짐. 리브라 키워드가 생겨나기 시작함. 금지 키워드 → 저품질 블로그 2)
  6. 소나 로직(2013) – 이미지, 동영상 영역까지 중복문서 검사 강화, 로봇이 투입되기 시작. 3)
  7. 라이브러리 로직(2014) – 카테고리 지수에 대한 강화. 로컬 IP지수 도입. 4)
  8. 세렝게티 로직(2015) – 로그인 한 경우 검색결과가 사람마다 다르게 반영됨

리브라는 2012년 12월 4일 몇몇 카테고리 (맛집,여행, 숙박 등)부터 적용이 되기 시작했으며, 소나는 2013는 12월 16일 부터 네이버 검색엔진에 적용이 되기 시작했다.

원인

네이버에 물어보면 답은 한결같다. 정상이라는 답변밖에 없고 검색엔진의 판단 조건은 비밀이라 알려줄 수 없다고 한다.

하지만 당신의 블로그 어딘가에 네이버 검색 엔진이 싫어하는 금칙어나 패턴이 있는 것이다.

다음은 여러 블로그들의 글에서 주장하는 원인들이다.

  1. 도배
    1. 하나의 키워드로 과도한 방문자 유입 5)
    2. 특정 블랙키워드 (네이버에서 내부적으로 설정한)
    3. 키워드의 반복
      1. 하나의 글에서의 똑같은 키워드를 본문에서 반복
      2. 연속된 여러 글에서의 똑같은 키워드의 반복 6)
    4. 실시간 키워드로 짧은 글 작성 7)
  2. 유사문서 / 중복문서 8)
  3. 광고글 혹은 체험단, 후기 등 상업성 글 9)
  4. 짧은 글 10)
  5. 하루에 특정 수 이상의 글을 올리는 경우 11)
  6. 글을 대량으로 삭제
  7. 조작 12)
  8. 저품질 블로그와 링크 교환 13)

증상

내 블로그의 글의 네이버 검색 순위가 갑자기 뒤로 밀려났다.

  1. 글을 아무리 작성해도 상위노출이 되지 않다.
  2. 네이버에서만 상위노출이 안된다
  3. 글 하나하나씩 상위노출에서 사라진다.
  4. 글이 보이질 않는다.

탈출

문제가 되는 시점의 포스팅은 내려준다.

포스팅을 작성 한 후. 그날부터 문제가 되기 시작한 것은 '비공개' 해준다. 그 글에 포함된 문제가 될만한 키워드, 링크가 있다면 추후 그런 내용이 있는 글은 작성하지 않다.

복붙금지

글 내용뿐 아니라 사진, 동영상도 다른 사람의 것이 아니라 본인이 직접 제작(혹은 편집)한 것을 사용한다.

도배금지

사실 블로그를 운영하다보면 검색엔진에 대한 욕심으로 인해서 의도적으로 키워드를 넣어서 제목을 작성할 수도 있다. 하지만, 이게 과하면 어김없이 3페이지로 간다. 특정 키워드를 남발하는 것은 독이 된다. 이것은 제목과 내용에 모두 적용된다. 읽기에 자연스러운 글이 좋다.

바깥고리

1)
갑자기 블로그 방문자가 뚝뚝 떨어지는 것들을 보면 사실임을 알 수 있다.
2)
대부분 그 당시 맛집 포스팅의 상위노출은 노하우는 ‘도배’ 였다. 맛집블로그마케팅, 맛집광고주, 맛집블로그대행사.. 이 세가지가 가장 큰 피해자였다. 대부분 이 세가지는 모두 상위노출은 모두 다 떨어지고 모두 다 저품질에 걸리기 시작했다. 그 상황에서 그 상황을 벗어나기 위해 똑같이 도배를 하는 작업을 계속해서 시도를 했지만, 2012년 12월 4일 이후 그 방법은 더이상 먹히지 않았다. 이 도배는 포스팅을 미친듯이 하는것과 스.댓.공 3종세트이다. 스댓공.. 바로 스크랩, 댓글, 공감 작업이다. 즉 어뷰징행위를 통해서 벗어나고자 했지만, 리브라로직이 나오고나서 이러한 기계적인 행위가 잡히는 블로그는 무조건 저품질 블로그가 되기 시작했다. 지금도 스댓공이 먹히지 않는것은 아니지만 예전 보다는 확실히 약해졌다. 이것이 리브라 이다.
3)
사람의 노가다 모니터링이 아닌 로봇프로그램이 도입되기 시작한다. 소나는 검색 로직의 일종으로 유사문서를 구분짓고, 광고성 블로그나 단순히 상위노출 목적의 도배성 글을 찾고 복사붙여넣기 판독 프로그램을 통해 관리하는 프로그램을 말한다. 이미지의 중복또한 걸러냅니다. 아무리 글을 다르게 써도 이미지가 중복이 되면~ 유사문서 판독이 될 수 있다. 유.사.문.서 구분, 바로 소나로직의 주 목적이다. 또 한가지, SONAR 시스템에서 중요한 것. 포스팅 후, 포스팅한 ID로 로그인한 상태에서 상위노출 되었는지 검색하지 말 것. 이라고 하다
4)
라이브러리 로직.. 이 로직은 검색로봇이 스스로 판단하여 검색결과를 수집하기 시작한다. 그에 따라 카테고리 지수에 대해 강화가 되기 시작한다. 이러한 라이브러리 로직이 말하는 것은 하나의 정해진 카테고리. 즉 맛집이면 맛집, 여행이면 여행, 숙박이면 숙박 등에 대해서 컨셉을 잡아 그 컨셉으로만 양질의 글을 쓰는 것이다. 상위노출, 검색자수가 아닌 내 글을 기다리는 사람이 얼마나 되는지 소통위주의 커뮤니케이션 블로그를 만들으라는 것이다. 상위노출로 검색이 많이 되는게 아닌! 내 블로그를 ‘브랜드’화 시켜 사람들이 직접 찾아오고 검색하게 만들으라는 것이다. 검색자가 내 블로그에 들어왓다가 나가서, 궁금증이 생겨 한번 더 검색하게 될 경우 내 블로그 지수가 높아지게 된다. 그리고 로컬지수가 도입되게 된다. 로컬 지수를 높이기 위해서는 동네글, 주변소개부터 시작하여야 한다. 예를들어서 내가 강남역에 살아서 강남역 맛집을 쓰게 된다면, 우선순위로 지수가 높아지게 된다는 것이다 (IP적용됨) 처음부터 뜬금없이 내가 강남역에 사는 포항맛집을 포스팅 할 경우 오히려 마이너스가 될 수 있다는 뜻이다. 이러한 라이브러리 로직은 “로컬지수+반응지수(체류시간 및 페이지뷰)+카테고리지수” 이다.
5)
평일 1000명씩 들어오던 블로그라고 예를들때 대박나서 하루에 5만명식 3일정도 들어온경우 갑자기 유입이 늘었지요? 그러면 후에 3페이지 이후로 밀려난다는 이야기가 있다. 한번에 많은 유입은 곧 네이버에서 제재조치를 당한다.
6)
남들이 쓰지 않은 신선한 글을 쓰는 것이 중요
7)
네이버 등에서 올라오는 실시간 검색어로 블로그 글을 즉시 작성하여 올리면 어뷰징 즉 의도적으로 검색의 품질에 방해를 한다고 하여 저품질 블로그가 될 수가 있다
8)
남의 글을 복/붙하는 경우 글을 판단하여 70%이상 같으면 배낀글로 판단하여 중복처리 한다고 한다. 기존의 글을 다른 블로그에 올리는 것 또한 검색 유입의 제한이 되는 것 같다.
9)
이건 유입이 어느정도 되면 업체에서 광고해달라고 들어온다. 문구는 자기들이 만든문구를 블로그에 올려달라고 하는데 이거하면 절대적으로 걸린다고 하다. 문구도 동일하고 중복글 확율이 거의 100%라고 한다.
10)
검색엔진은 체류시간이란 것을 파악 한다. 즉 사람들이 여러분들이 운영하는 사이트에 와서 어느 정도 머물다가 가는지를 체크를 한다
11)
하루에 4~5개씩 많은량의 포스팅을하면 로봇이 생각하기엔 프로그램으로 오인할 수도있고 유익한 정보가 적다고 생각 할 수도 있다
12)
댓글조작, 공감조작, 키워드를 흰색으로 숨김 등의 조작
13)
나쁜놈들과 자주 어울리면 너도 나쁜 놈일 가능 성이 높다고 판단을 한다. 따라서 스팸이나 상업성 글을 남발하는 블로거들과의 교류는 오히려 저품질 블로그 탈출에 악영향을 가져 올 수도 있다는 사실을 염두하기 바란다.