네이버에서 ‘오빠랑’은 이제 그만 빅데이터 기반 맛집 검색 다이닝코드

상세페이지

  • HOME > 인물 인터뷰

네이버에서 ‘오빠랑’은 이제 그만 빅데이터 기반 맛집 검색 다이닝코드

식사는 열량이나 영양소 등의 과학적인 접근보다 의미가 더 중요한 때도 있다. 우리는 데이트를 할 때, 좋은 일이 있을 때, 심지어 나쁜 일이 있을 때도 음식을 앞에 놓고 소회를 푼다. 그래서 맛집 파워블로거의 거짓말만큼은 용서할 수 없다. 그런데 네이버 검색 외에 별다른 방법이 있나?

글 · 사진. 이종철 기자 jude@websmedia.co.kr




왜 맛집 검색을 빅데이터로?

다이닝코드의 신효섭 대표는 데이터베이스 전공자였고 약 5년가량 삼성전자 소프트웨어센터에서 근무했다. 그 이후 건국대 인터넷·미디어공학부에서 교수 생활을 시작했다. 흔히 생각하는 것과 달리 ‘교수’의 일은 두 가지다. 교육과 연구. 그는 일부 교수들과 다르게 연구에 힘을 쏟았다. 약 2005년부터 10년간 검색 기술, 데이터마이닝 등의 연구에도 매진했다.

2010년에는 네이버(당시 NHN)에서 파견 연구원 생활을 하기도 했는데, 이때 네이버 블로그 1년 치 데이터를 분석하고 기술 검증의 시간을 가졌다. 그가 당시 연구했던 분야는 맞춤법이었는데, 리뷰성 포스트가 많은 네이버 블로그 특성에 맞춰 영화, 요리, 여행 등에 대해서도 자신의 기술을 검증하는 단계를 거친다. 그가 궁금했던 것은 스마트폰이나 MP3P, 맛집, 펜션 등 각 제품군 중 좋은 것들을 선별할 수 있느냐는 것이다. 특히 맛집에 관해서는 모두가 공감할 것이다. 현재의 네이버 블로그로 진정한 맛집을 검색하기는 어렵다. 데이터가 그야말로 방대하고, 자신의 생활을 꼭 아름답게 만들려는 한국 블로거 특성도 있다. 그래서 그가 생각한 것이 자신의 전공인 빅데이터와 데이터 사이언스였다. 물론 이것을 연구의 영역으로 남겨둘 수도 있다. 그러나 이런 상용 기술은 기술이 고도화될수록 이득을 보는 이가 많아진다. 그래서 그는 스타트업으로 출사표를 던졌다.

사실 교수는 기술기반 사업을 하기에 좋은 조건을 갖춘 직업이다. 정부에서 연구자금을 받을 수 있고, 교내 연구실에서 학교 인프라들을 활용하며 학생들과 함께 공부하듯 연구할 수 있기 때문이다. 다만 한 업체의 대표로서 교수가 누렸던 존경과 권위를 내려놓는 것이 어렵다면 어렵다. 교수가 기술만을 연구한다면 이것이 실제로 사업에 반영되는 데에도 복잡한 절차가 필요하다. 그래서 그는 진짜 사업체의 대표가 돼버렸다.



폭풍 흡입하고 싶은 음식

다이닝코드가 주력으로 내세우는 빅데이터는 그 정의를 만족시키기 위해서는 몇 가지 조건이 있다. 다양한 소스로부터 데이터를 수집해서 받는 과정, 데이터가 이질적일 때 분석하는 과정을 거쳐야 한다. 이 과정에서 텍스트 분석, 이미지 인식 등 규격화돼있지 않은 비정형 데이터 분석과, 헤테로지니어스 컴퓨팅(CPU와 GPU를 모두 활용해 컴퓨팅 능력을 비약적으로 상승시키는 방법, 병렬 컴퓨팅) 등의 데이터 가공 과정이 필요하다. 단순 통계와 빅데이터가 다른 이유다. 다이닝코드의 소스는 네이버, 티스토리, 다음 등 맛집 블로거의 블로그 콘텐츠이며 이것을 분석하는 과정이 다이닝코드가 하는 일이다.

데이터 분석 과정은 수집-평가-정리의 과정을 거친다. 일단 일정 단위로 맛집 블로거 포스팅을 수집하고, 그것을 기본으로 분석을 시작한다. 예를 들어 특정 맛집의 이름과 지역을 컴퓨터가 인식하고, 그 포스팅에 어떤 평가(긍정/부정)를 내렸는지를 분석한다. 긍정 및 부정은 ‘짱’, ‘쩔어’, ‘폭풍흡입’ 등의 긍정적인 단어들과 ‘한 입 먹고’, ‘개짜증’ 등의 부정적인 키워드를 골라 분석하는 것. 오타나 신조어 등의 단어가 등장해도 무리가 없다. 그들의 컴퓨터에는 ‘머신 러닝’이 적용돼있기 때문이다. 머신 러닝은 데이터를 분석할 때 서버 컴퓨터가 인간의 언어 단순 좋다/나쁘다로 구분하는 것이 아니라, 특정 단계에 맞춰 긍정의 정도, 부정의 정도, 반어법, 오타, 신조어 등을 스스로 학습하는 기능이다. 예를 들어 ‘폭풍흡입’ 단어는 처음에는 자연현상(폭풍)이나 의학용어(흡입)로 인식됐을 것이다.

그러나 다른 데이터들과의 비교를 통해 점차 ‘폭풍’이 강조를 위한 단어임을 인지하고, ‘흡입’이 ‘먹는 것’임을 인지하는 방식이다. 그래서 ‘폭풍흡입’은 배가 고프거나, 그만큼 맛있었다는 의미가 된다. 반대로 유사 단어를 인지할 수도 있다. 한 때 맛집계를 휩쓸었던 매직 키워드 ‘오빠랑’은 ‘데이트’를 의미함을 이해하는 것이다. 감정 정서를 갖고 있지 않은 컴퓨터는 인공지능과 대량의 데이터를 통해 단어의 의미와 관계를 배우고, 맛집 순위를 매기는 데 반영한다. 따라서 데이터가 많으면 많아질수록 머신 러닝의 정확성은 높아진다. 이러한 인공지능과 데이터마이닝, 통계분석, 결정 등은 다이닝코드 내부의 알고리즘을 통해 성숙하며, 이것이 다이닝코드의 코어 기술이다. 이외에도 20개 분야의 요소 기술과 100개 정도의 분석 모듈을 활용하고 있다. 놀라운 점은 다이닝코드가 단 열 명으로 이뤄진 기업이라는 것. 데이터를 잘 학습할 수 있도록 보정해주는 인물을 제외하면 모든 것을 컴퓨터가 스스로 하기 때문이다.


 


불완전한, 그러나 피로하지 않은 맛집 검색

다이닝코드의 서비스는 실제로 어떨까? 접속해보면 그 위용을 깨달을 수 있다. 웹사이트에서 지역이나 먹고 싶은 음식을 입력해보자. ‘초코파이’, ‘티라미수’, ‘츄러스’ 등 식사가 아닌 것들도 검색되며, 더 나아가 ‘상견례’, ‘소개팅’, ‘돌잔치’ 등 사람간 관계가 포함된 것들도 검색된다. 만약 배가 많이 고프거나 하는 특정 상황이 있다면 ‘대학로 배터지는’, ‘건대 발렛’ 등의 검색도 가능하다. 이때 나타나는 키워드는 자동으로 정리된 것이며, 사진도 주제와 적합한지를 매칭시켜 선택된다.

그런데 ‘파워블로거지’로 불리는 대가성 포스팅 위주의 블로거가 검색되진 않을까? 그래서 다이닝코드에는 자체적인 평판 시스템이 있다. 다이닝코드가 내부적으로 가진 기준에 맞춰 대가성 포스팅을 악용하는 경우에는 내부적인 평판이 떨어진다. 이 블로거는 차츰 다이닝코드의 검색결과에 큰 영향을 미칠 수 없게 된다. 물론 대가성 포스팅을 정당하게 할 경우 이런 부분은 큰 문제가 되지 않는다. 식사를 무료로 했다고 해서 맛있는 집을 맛없다고 할 수도 없는 노릇이니까. 사실 대가성 포스팅보다 더 심각한 문제는 ‘관리형 블로거’다. 몇 개의 맛집에 매월 돈을 받고 블로그에 주기적으로 업로드하며, 해당 글을 삭제 후 반복 포스팅하는 블로거들 말이다. 더 큰 문제는 이들이 그룹을 형성하고 있다는 것. 이들이 글을 남기면 비슷한 일을 하는 그룹 블로거들이 무조건 댓글을 달고 긍정적인 평가를 한다. 영향력있는 블로거들이므로 금방 인기 포스트로 올라가기도 한다. 다이닝코드의 컴퓨터는 이들의 관계를 추적하는 알고리즘으로 그들의 평판을 조정한다. 그들이 손해보는 건 없다. 다만 다이닝코드의 검색 결과가 더 깔끔하고 정확해질 뿐.

최근에는 다이닝코드 안드로이드 앱도 출시됐다. 웹도 편하지만 앱은 더 편하다. 맛집의 랭킹이 지도에 실시간으로 나타나고, 지도를 보고 직접 찾아갈 수도 있다. 위치기반 기능 역시 앱에서 더 안정적이다.
아직 다이닝코드의 알고리즘은 완벽하지 않다. 그러나 발전할 것이 확실하다. 이 기술은 몇 가지 조정을 통해 병원, 숙박, 제품 평판의 서비스로 변신할 수도 있다. 그 자체로 학자이자 서비스 업체인 신효섭 대표는 서비스를 꾸준히 발전시키면서 “스타트업 정신으로 스케일이 큰 서비스를 만들어 사용자들에게 사랑받는 검색엔진을 제공하겠다”고 밝혔다.


www.diningcode.com
next fellow 릴레이톡 리부트(Re-Boot)
3년 간 여러 스타트업을 인터뷰해왔던 릴레이톡은 3주년을 맞아 리부트를 실시합니다. 기술 기반 혹은 특별한 서비스, 페인킬러형 벤처기업 등 인터뷰를 원하는 다양한 청년 스타트업은 연락 주시기 바랍니다.

tags 이종철 편집장 , 다이닝코드 , 빅데이터 , 맛집 , 오빠랑

저작권자 © 웹스미디어 무단 전재-재배포 금지

뉴스콘텐츠는 저작권법 제7조 규정된 단서조항을 제외한 저작물로서 저작권법의 보호대상입니다.
본 기사를 개인블로그 및 홈페이지, 카페 등에 게재(링크)를 원하시는 분은
반드시 기사의 출처(로고)를 붙여주시기 바랍니다.
영리를 목적으로 하지 않더라도 출처 없이 본 기사를 재편집해 올린 해당 미디어에 대해서는 합법적인 절차(지적재산권법)에 따라
그 책임을 묻게 되며, 이에 따른 불이익은 책임지지 않습니다.

URL 복사 출력하기 목록보기 스크랩하기

관련기사

최신뉴스
오늘의 뉴스
진짜 맛집 검색 서비스 ‘다이닝코드’, 모바일 앱 정식 출시
UX & UI
영화로 엿본 미래 디자인 인터스텔라
인물 인터뷰
네이버에서 ‘오빠랑’은 이제 그만 빅데이터 기반 맛집 검색 다이닝코드
월드리포트
힙스터의 소셜 네트워크 엘로
리뷰 & 하우투
드디어 완성, 아이폰6&아이폰6 플러스

정기구독신청