네이버라는 우물 안의 국내 웹 환경을 말하다

상세페이지

  • HOME > 월별 특집 & 기획

네이버라는 우물 안의 국내 웹 환경을 말하다

 “한국어 웹에는 좋은 정보가 별로 없다”, “새로운 정보를 찾으려면 영어나 일본어 웹사이트를 검색해 봐야 한다”는 식의 이야기를 주변에서 종종 듣는다. 한 국가의 인터넷 발전을 논할 때 우리는 결코 기술의 발전만을 이야기하지 않는다. 우리는 기술과 함께 얼마나 많은 양질의 정보를 효율적으로 생산해 단절 없이 빠르고 넓게 유통될 수 있는가로 한국의 인터넷 발전, 정보 인프라의 발전을 측정해야 한다.

박세용 어센트네트웍스 대표
sypark@ascentnet.co.jp


  웹사이트를 만들 필요가 없는 나라, 대한민국

기업이 웹사이트 제작에 시간과 돈을 들이는 이유는 콘텐츠를 제공함으로써 잠재 고객을 찾아내고 이들과 특별한 관계를 구축할 수 있기 때문이다. 기본적으로 웹사이트의 콘텐츠는 이를 소비할 방문자와 독자를 전제로 제작하기 때문에 웹사이트를 운영하는 입장에서 트래픽 확보는 운영 동기이자 보상이고 목표라 할 만큼 중요하다.

한 웹사이트가 트래픽을 확보하는 방법에는 배너와 같은 디스플레이 광고나 검색 키워드 광고 등의 ‘페이드 미디어(Paid Media)’를 통한 유입과 소셜 미디어나 PR 활동 그리고 콘텐츠를 소개하고 인바운드 링크를 걸어주는 외부 리퍼럴 사이트 등의 ‘언드 미디어(Earned Media)’를 통한 유입, 콘텐츠를 검색 엔진을 통해 노출함으로써 얻게 되는 온드 미디어(Owned Media)를 통한 자연 유입(Organic Search Traffic)이 있다. 이런 트래픽 확보 방식들은 인터넷이 보편화한 곳이라면 언어나 국가에 관계없이 거의 일반적이다.

그런데 유독 우리나라만큼은 위에서 소개한 트래픽 유도 방법 중 검색 엔진을 통해 온드 미디어로의 직접적인 트래픽 유입을 발생시키는 방식이 지난 10여 년간 거의 기대하기 어려웠다. 필자는 그 원인으로 네이버의 검색 서비스인 ‘통합 검색’을 지목한다. ‘통합 검색’은 전 국민의 70~80%가 사용하는 네이버 검색에서 우리가 일상적으로 접하는 검색 결과다. 이 통합 검색은 네이버만이 아니라, 다음과 네이트에도 영향을 미쳐서 이제는 대한민국의 검색 표준처럼 자리잡았다. 이 통합 검색의 특징은 검색 결과를 보여 줄 때 블로그, 카페, 뉴스, 지식인, 웹 문서, 이미지 등과 같이 콘텐츠를 담은 컨테이너의 종류별로 검색 결과를 구분하고 종류별로 상위에 올라온 3~5개를 블록으로 구성해서 보여준다. 필자가 2014년 봄에 자동차 구매와 관련한 100여 개의 키워드를 가지고 네이버의 검색 결과 페이지를 조사했던 결과를 보면 통합 검색의 검색 결과의 상단(상위 2개의 카테고리, 대략 10개의 링크가 보이는 범위)에 노출되는 영역들은 아래와 같았다.


 ❶ 블로그 검색 36%  ❷ 카페 검색 25%  ❸ 뉴스 검색 17%  ❹ 지식인 13%  ❺ 웹 문서 9%


이는 한국의 대표 검색 서비스인 네이버를 통해서 직접 트래픽을 자신이 운영하는 웹사이트로 유도할 가능성이 고객들이 검색하는 키워드 전체 중에 겨우 9%의 키워드의 결과에서만 가능하다는 이야기이다. 더욱이 검색 결과 상단에 가장 많이 보이는 영역인 블로그 검색 결과를 간이로 조사해본 결과, 네이버 블로그의 검색 결과 다섯 개 중에서 네이버 블로그가 점유하는 비율이 40~70% 정도였고, 카페 검색의 경우에는 네이버 카페의 점유율이 당연한 이야기지만 100%였다. 네이버 검색은 사실상 내부 DB 검색이라고 말해도 과언이 아니다.

이쯤 되면 국내 기업들은 검색을 통해 웹사이트로 트래픽을 모을 방법이 없어서 검색 엔진 최적화를 신경 쓸 필요가 없어졌다고 말할 수 있을 것이다. 바꿔 말하면 트래픽 유도만 생각한다면 “우리나라에서는 굳이 웹사이트를 만들 필요가 없다”는 이상한 결론에 이르게 되는 것이다. 이런 상황에서 한국 기업들의 웹사이트는 광고나 PR, 영업을 통해 직접 URL을 치고 들어오는 고객이 주 대상이 되기 때문에, 첫 이미지를 좌우하는 디자인성 높은 메인 페이지를 만들거나, 비주얼적으로 독특한 UI를 설계하거나, 최상단 웹사이트에서 하부 페이지의 논리적 관계를 중시한 나머지 검색 크롤러가 접근하기 어려울 심한 계층형 사이트를 만들게 된다. 결국, 기업 웹사이트란 것이 기존 고객을 위한 형식적인 채널에 불과해지고, 그러다 보니 굳이 잠재 고객을 위한 콘텐츠를 개발할 필요가 없어지면서 콘텐츠 개발에도 상대적으로 힘을 덜 쏟게 되는 것이다.

한국어로 등록된 위키피디아 정보는 297,528개, 일본어로 등록된 정보는 937,823개, 영어 정보는 4,670,018개, 중국어 정보는 800,295개다. 위에서 말한 것처럼 검색을 통해서 직접적인 트래픽 유입을 기대할 수 없는 환경이 만들어낸 슬픈 결과다. 한 국가의 인터넷 발전을 논할 때 우리는 결코 기술의 발전만을 이야기하지 않는다. 우리는 기술과 함께 얼마나 많은 양질의 정보가 효율적으로 생산돼 단절 없이 빠르고 넓게 유통될 수 있는가로 한국의 인터넷 발전, 정보 인프라의 발전을 측정해야 한다.




검색 서비스의 공공성 회복에 대해서                                                                    
지금처럼 인터넷이 국가의 중요한 정보 인프라가 된 상태에서 정보를 생산하는 사람과 정보를 찾는 사람을 빠르고 효율적으로 연결해주는 것은 국가의 경쟁력 확보에 중요한 일이다. 한 국가의 혁신이 이런 정보의 유통 경쟁력으로부터 나오게 된다는 것은 굳이 여기서 논할 필요도 없는 이야기다. 그런 의미에서 정보를 찾는 사람과 정보를 생산하는 사람을 연결해주는 검색 서비스는 공공성을 가진다.

검색 서비스는 크게 웹 페이지를 읽어들이는 크롤러와 읽어들인 콘텐츠를 분류해 보관하는 색인 그리고 이 콘텐츠 중에서 해당 키워드에 관련성이 높은 순으로 정렬하는 랭킹과 이를 보기 쉽게 하는 UI로 구성된다. 좋은 검색 서비스를 위해서는 오랜 기간 크롤링과 색인, 랭킹 부분에서 기술 개발을 해야 하고, 막대한 인프라를 구축하기 위한 많은 투자가 필요하다. 더욱이 검색 엔진은 다른 사람이 제작한 콘텐츠를 자신의 웹 서버에 가져다가 색인하고, 여기에 광고를 붙여 매출을 내기 때문에 기본적으로 저작권 침해 요소를 가지고 있다. 그럼에도 불구하고 검색 서비스를 예외적으로 합법적인 것으로 허용하는 것은 이 검색 서비스가 가진 공공성 때문이며, 전적으로 사회적 합의에 의한 결정이다.

일본이나 미국의 경우에도 2004-2009년에 걸처 검색 서비스가 저작권법을 위반하는 것이냐, 아니냐에 대해 심도있는 논의를 해왔다. 기존의 법체계 안에서 보자면 분명히 외부의 콘텐츠를 캐쉬해 자신의 서버에 보관하는 검색 엔진의 색인 행위는 저작권법 위반이라고 할 수 있다. 그러나, 많은 국가들이 인터넷이라는 새로운 매체의 성장을 어떻게든 장려해서 국가 전체의 발전에 기여해야겠다는 전략적 선택을 했다. 그래서 공공의 효용 극대화를 고려해서 사회적 합의에 의한 선택을 통해 법적인 책임을 면제해 준 것이다. 이런 합법화 작업이 일어난 것이 미국은 2004년이고, 일본은 2009년이다. 한국은 이런 과정이 크게 공론화된 시기가 분명하지 않으나, 검색 엔진의 공공성이라는 부분과 국가의 전략적 선택이라는 이유에서 검색 엔진을 불법으로 인정하지 않았다는 것은 분명하다.

검색 엔진 서비스는 규모가 충분히 커지면 황금알을 낳는 거위와 같다. 필자가 강조하고 싶은 것은 이런 황금알을 낳는 사업인 검색 서비스가 가진 공공성이다. 사업자는 높은 수익을 내는 대신, 많은 사람들이 생산하는 정보를 잘 크롤링해 정보를 찾는 이들에게 빠르게 효율적으로 매칭해주기 위한 막대한 투자를 게을리 하지 말아야 한다. 특히, 대다수의 한국 국민이 사용하는 검색 사업자인 네이버가 만약 이런 의무를 다하지 않은 채로 검색 서비스를 통한 매출을 올리는 일에만 집중한다면, 우리는 네이버 검색이 가진 공공성의 의미를 깨닫게 해줄 필요가 있을 것이다.
앞에서도 길게 이야기했던 것처럼 네이버의 현행 통합 검색은 크롤링과 색인 그리고 랭킹을 중요하게 생각하는 웹 검색이 아니다. 사실 그렇게 해야 할 이유도 없었다. 따라서 적어도 현재는 한국어로된 다양한 콘텐츠를 찾는 검색 니즈에 제대로 대응하지 못하는 서비스가 돼 있다.




검색 공공성 VS 검색 중립성

“검색 중립성이란 개념도 아직은 합의가 돼 법으로 규정된 원칙이 아닙니다. 초기 검색 서비스를 놓고 보면, 검색 중립성 개념에서 후발주자는 결코 1등을 이길 수 없습니다. 똑같은 검색어에 대해 A와 B 검색 서비스가 서로 다른 결과를 맨 위에 보여준다면 둘 중 하나는 검색 중립성을 해친 게 아니겠습니까  모든 검색이 똑같은 검색 결과를 보여준다면 검색이 여러 개 있을 필요가 없겠죠.”

김상헌 네이버 대표가 2013년 7월 12일에 한 이야기다. 검색 중립성이라 함은 A와 B중 어느 결과가 먼저 보이던 검색 서비스 사업자가 인위적인 편집을 하지 않는 것인데, 김 대표는 의도적으로 꼬아서 설명하면서 중립성 논쟁을 일으키고 있는 것으로 보인다. 필자는 네이버 문제의 핵심은 검색 중립성이 아니라 검색 공공성의 회복이라고 보기 때문에, 김 대표가 이야기에서 언급한 것에 대해 시비를 걸 생각은 없다. 하지만 아래 이유로 네이버가 비난을 받아야 한다고 생각한다.

첫째, 많은 인터넷 정보가 네이버의 검색 결과에 애초부터 포함될 수 없는 운명을 가지고 있다. 한글로 작성된 콘텐츠임에도 많은 웹 페이지들이 크롤되고 인덱스 되지 않고 있다. 어찌 그런 상태에서 만들어진 검색 결과가 좋은 검색 결과라 할 수 있을까. 다른 사람들이 제작한 콘텐츠를 읽어와서 보관하고, 이를 이용해서 비즈니스 하도록 허락한 데에는 분명 검색이 가진 공공성에 대한 사업자와 사회의 합의가 있었던 것을 잊지 말아야 한다.

둘째, 광고, 카페, 뉴스, 지식인, 블로그, 웹 검색 등을 5개 이상씩 보여주는 방식으로는 좋은 내용을 가지고 있는 웹 페이지가 검색 결과 첫 페이지에 나오기란 사실상 불가능에 가깝다. 그래서 다들 네이버 블로그나 네이버 카페를 좋아하지 않더라도 이걸 쓸 수밖에 없도록 강제하고 있다. 네이버가 의도했던, 안 했던 말이다.

셋째, 많지는 않지만 한국 안에서도 많은 이들이 새로운 검색 서비스를 만들어 보려고 노력하고 있다. 구글도 지금의 시장 점유율을 넘어서 보려고 많은 노력을 기울이고 있다. 그런데 네이버는 다른 검색 엔진들이 네이버의 웹 서비스들을 자유롭게 크롤할 수 없게 막고 있다. 네이버 블로그도 구글에서 아주 제한적이다. 이것은 일본이나 미국과 같이 웹 검색이 일반적인 나라와 정반대의 일을 네이버 블로그가 하는 것으로 볼 수 있다. 구글의 검색창에서 “site:도메인명”이라는 명령어로 검색하면 해당 도메인 하부에 있는 콘텐츠에 대해 구글이 행한 색인 상태를 어느 정도 확인할 수 있는데, 다음은 이를 통해서 확인해 본 결과다. ‘site:blog.naver.com’이라고 확인해보면 구글에 색인된 네이버의 블로그 포스트 숫자가 95만 개 정도 나온다. ‘site:*.blog.me’이라고 확인을 하면 색인이 아예 되질 않는 것으로 나온다.

네이버의 활동 블로거 수가 1,600만이라고 한다. 물론 복수의 블로그를 운영하거나 기업 블로그들이 상당수 있다고 하더라도, 포스트 숫자는 당연히 블로거 수의 수배는 나와야 한다. 구글에 색인된 숫자가 95만이라면 상당히 적은 숫자다. 그리고 네이버 개별 블로그의 소스를 보면 noindex라고 돼 있는 것을 볼 수 있다. 블로그를 운영하는 사람 중 자신이 색인해 가지 말라는 내용을 담은 소스를 사용하고 있음을 알고 있는 사람은 얼마나 될까.

네이버는 2003년 전후, 한게임과 블로그와 지식인 서비스로 검색에 트래픽을 집중했고, 검색을 통해 블로그와 지식인을 강화했다. 그리고 어느 순간부터 콘텐츠를 색인이 안 되게 막아서, 다른 검색들이 네이버의 콘텐츠를 색인할 수 없게 했다. 이건 명백한 불공정한 행위이다. 네이버가 NHN 일본을 통해 운영하는 웹큐레이션 서비스 '마토메(Matome, matome.naver.jp)'는 한국의 네이버 블로그와는 달리 ‘matome.naver.com’으로 색인상태를 조사할 때 1,500만 페이지 이상이 나오는 것을 보면 네이버의 스탠스(Stance)가 명확해진다. 작년, 소위 ‘네이버 때리기’가 업계에 나타났을 때, 개인적으로는 검색 중립성에 대한 논의에 집중되는 것이 아쉬웠다. 핵심은 검색 공공성에 있었기 때문이다. 검색 서비스는 공공성이 강한 웹 서비스다. 따라서 대한민국의 1위 사업자, 그것도 사실상의 독점 사업자인 네이버에 사업을 영위할 수 있는 권리와 함께 엄격한 의무도 확실하게 부과해야 한다. 네이버 검색의 공공성 회복을 위해서 우리 사회가 네이버에게 부과했으면 하는 세 가지의 의무 사항을 정리하면 다음과 같다.



❶ 한국어로 된 모든 웹 콘텐츠를 색인한다는 목표에 따라 전체적인 한글 콘텐츠의 양에 대해 매년 추정치를 발표하고, 이에 대한 크롤 및 색인 상황, 개선을 위한 향후 구체적인 로드맵을 매년 발표할 것. 가능하다면, 현재의 통합검색 서비스와는 별도의 웹 검색 서비스를 운영한다. ❷ 네이버 이외의 다른 경쟁 검색 엔진들이 네이버의 콘텐츠들을 색인하는 데 어려움을 겪지 않도록 기술적 표준을 준수할 것(카페와 같은 로그인 베이스의 콘텐츠를 제외한 오픈 플랫폼상의 모든 콘텐츠를 대상으로 함) ❸ 검색 엔진을 전문으로 한 경쟁 벤처가 나타났을 경우 불공정한 경쟁을 하지 않으며, 인수 합병을 추진함으로써 경쟁을 방해하지 않는다.
네이버가 이 정도 수준에서 검색 공공성 회복에 대한 요구에 대응해 준다면, 필자는 네이버가 부동산 시장에 참여하든 패션 사업에 참여하든 전자 상거래 시장에 참여하든 전혀 개의치 않을 것이다. 그만큼 검색 공공성의 회복은 국내 인터넷의 환경의 정상화에 중요한 부분이라고 생각한다.



SEO를 잊어버린 나라

검색 엔진 최적화는 사실 2002년 정도만 해도 국내에서 그리 낯선 단어는 아니었다. 그 당시만 해도 국내의 검색 환경도 해외와 다르지 않게 웹 검색이 주된 검색 엔진이었기 때문이다. 그러나 2003년 이후로 네이버의 독주가 시작되면서 10여 년이 지난 지금 국내에서는 SEO라는 단어가 사라지고 그 대신에 네이버 검색 결과에서 네이버 블로그와 네이버 카페 그리고 네이버 지식인에 자사 브랜드나 상품에 대한 우호적인 콘텐츠를 게재하고 이것을 검색 결과를 통해 잠재 고객들에게 보여주는 소위 한국형 바이럴 마케팅이 자리 잡았다.

해외 시장에서는 SEO 업체와 검색 엔진 간의 사이가 절대 나쁘지 않다. 예를 들어 미국의 대표적인 서치엔진 마케팅 관련 콘퍼런스인 SES(Search Engine Strategies), SMX(Search Marketing eXpo), Pubcon(Pub Conference) 등에는 거의 예외 없이 구글이나 마이크로소프트의 빙 검색 엔진 관련 담당자들이 참여해 몇 개씩의 세션을 맡는다. 이런 것이 가능한 것은 검색 엔진이 SEO를 자신들의 알고리즘을 악용해서 검색을 조작하는 업체로 보는 것이 아니라, SEO업체들을 통해서 기업들이 보다 검색 엔진 친화적인 콘텐츠를 제작하게 되고, 이를 통해서 검색 엔진은 더 양질의 콘텐츠를 빠르고 정확하게 크롤링하고 색인할 수 있게 된다고 믿었기 때문이다.

SEO라는 단어가 사라진 10년 동안 우리는 모바일 혁명의 한 중간에 들어서 버렸다. 그리고 2014년 드디어 모바일 검색 볼륨이 데스크톱 검색 볼륨을 넘어섰다. 더는 네이버의 통합 검색에 대중이 만족할 수 있는 상황이 아니다. 이미 인터넷을 익숙하게 다루는 사람들 사이에서는 업무를 위한 중요한 정보를 찾을 때에는 네이버가 아니라 구글을 이용하는 것이 상식이 된 지 오래다. 이제는 네이버도 웹 검색에 대한 원천 기술 확보를 위한 노력을 쏟아 부으며 새로운 시도를 해야 하고, 웹사이트를 제작하는 웹 에이전시와 사이트 운영자들도 기획 단계에서부터 SEO를 고려해야 할 시기에 접어들었다고 생각한다. 그럼에도 글로벌 경쟁의 한 중간에서 세계의 트렌드를 이끌어가야 할 우리나라 기업과 한류가 사랑받으며 많은 국가로부터 정보 제공의 요청을 받고 있다. 공전의 히트를 계기로 많은 국가로부터 정보 제공의 요청을 받고 있을 공공기관들의 외국어 웹사이트 검색 엔진 최적화는 거의 재난 수준이다.

웹표준솔루션포럼(WSSF)이 2014년 가을에 조사해 발표한 결과를 보더라도, 국내 공공기관의 영문 사이트와 국내 시가총액 상위 기업들의 영문 웹사이트의 검색 엔진 최적화 수준은 최고 레벨에 있는 곳도 C 이상이 없다. 그것도 대부분은 D~F의 레벨 평가를 받았다. 두말할 것도 없이 이런 상황은 반드시 개선돼야 한다. 특히 모바일 검색의 보편화로 24시간 어디서나 검색을 하는 상황에서 검색 엔진 최적화에 대한 미흡한 대응은 국가적 손실과 직결될 것임이 틀림없다.

지난봄 전지현, 김수현 주연의 <별에서 온 그대>라는 드라마가 해외에서까지 공전의 히트를 했다. 그러면서 드라마와 배우의 인기는 그들이 먹고 입었던 치맥과 천송이 코트 같은 국내 상품들로 이동했다. 그 과정에서 이야기가 자연스럽게 한국의 인증서 문제로 번지기 시작했고, 대통령까지 나서서 이 문제를 국무회의에서 언급하고 정부 각 부처에서 이 문제 해결을 위해 작은 소동이 일어나기도 했다. 이때 필자가 아쉬웠던 점은 바로 이 이야기가 한국 주요 웹사이트들의 검색 엔진 최적화 문제로 연결되지 못한 부분이다.

외국인들이 우리나라의 제품을 찾아서 들어오려면 당연히 웹 검색을 통하게 돼 있다. 아무리 결제가 편해도, 외국어로 잘 만들어도 소용없는 일이다. 외국의 잠재 고객들은 네이버가 아니라 구글, 야후, MS의 빙, 바이두와 같은 웹 검색 엔진을 사용해서 제품을 찾게 될 텐데, 지금의 우리나라 대기업이나 공공기관의 외국어 사이트로서는 이런 트래픽을 받아낼 수 없다. 이미 2014년 상반기 전자 상거래를 통한 무역 적자만도 5억 달러가 넘는다고 한다. 걱정은 이미 현실이 돼 있다.
우리나라는 대외 무역 교역량 규모 면에서 세계 11위의 상품·경쟁력을 갖춘 국가다. 인터넷은 우리에게 결코 불리한 공간이 아니다. 그럼에도 이번 <별에서 온 그대> 때문에 발생한 에피소드는 국내 웹 서비스가 글로벌 기준으로부터 얼마나 떨어져 있었는가를 인식하게 해준 계기가 될 것이다.
이런 상황 속에서 해외 다국적 기업들의 한국 진출에 대해서 한국적 표준이란 규제 장벽을 치는 전략으로 시장을 지키는 방향으로만 일을 처리해서는 안 된다. 오히려 이런 수비적인 자세를 벗어나 인터넷 글로벌 표준을 적극적으로 활용해서 경쟁력을 갖춰 비즈니스의 기회를 적극적으로 만들어내는 공격적인 태도를 보이는 것이 중요하다.

우리는 지난 10여 년간 네이버가 독점적으로 지배하는 SEO가 필요 없는 웹 환경에서 지내 왔다. 그러나 앞으로의 10년은 그렇게 되어서는 안 된다. 철저하게 지금의 문제를 돌아보고 반성하고 변하고 배워야 한다. 이런 경쟁력이 없는 웹 환경을 우리 후세에 물려줘서는 안되기 때문이다. 





NHN재팬의 마토메의 도메인 하에서 색인된 페이지수 15,300,000건 



SMX행사에 참여한 구글 웹스팸 팀장과 서치엔진랜드의 대표     

tags 서종원 기자 , Hci 2015 , 심준식 , 렛시 , 증강현실 , 반응형 웹

저작권자 © 웹스미디어 무단 전재-재배포 금지

뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다.
본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은
반드시 기사의 출처(로고)를 붙여주시기 바랍니다.
영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라
그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.

URL 복사 출력하기 목록보기 스크랩하기

관련기사

최신뉴스
월별 특집 & 기획
눈에 보이는 것이 진짜일까? 트루 컬러 스토리
월별 특집 & 기획
사물이 내게 말을 건다 증강현실 웹 기술
월별 특집 & 기획
네이버라는 우물 안의 국내 웹 환경을 말하다
UX & UI
근미래 스마트 디바이스 향연 빅매치
프로젝트 & 프로모션
한 해를 점쳐줄 애플리케이션 2015 완벽한 운세

정기구독신청