다음카카오, 패시, 오라클의 데이터 활용법

다음카카오, 패시, 오라클의 데이터 활용법

Summary:

오늘 접했던 소식 중 인상 깊은 내용들을 전합니다.


다음의 꼼꼼히 본 뉴스 섹션 개설

카카오, “독자가 깊이 읽은 좋은 뉴스 추천”

페이지뷰 수나 체류시간 등으로 좋은 기사를 판단할 수 있다. 단 페이지뷰수만로 뉴스 콘텐츠를 평가하면 낚시성 제목이 많아진다는 비판이 있다. 이에 카카오는 열독률 지수를 반영한 ‘꼼꼼히 본 뉴스’ 카테고리를 신설하여 뉴스의 길이나 형태, 뉴스 페이지에 체류한 시간 등을 고려해 독자가 얼마나 뉴스를 꼼꼼히 읽었는지 분석했다.

조회수가 적어도 깊은 관심과 주목을 받은 글들도 뉴스에 잘 노출될 것으로 보인다. 카카오는 열독률 지표 데이터를 다음뉴스 제휴 언론사에게도 제공할 계획이다.

“본문 내 이미지의 개수와 글의 길이를 보면 평균 체류시간이 나온다. 그런데 가령 그림이 2개, 본문이 300자인 기사의 평균 체류시간이 30초인데, 같은 조건의 특정 기사는 60초가 나왔다. 그렇다면 두 번째 기사의 본문 집중도가 높은 것. 그걸 지수화한 게 카카오가 자체 개발한 ‘열독률 지수’다. 글의 길이뿐 아니라 본문 내 이미지의 개수, 영상의 길이도 고려한다.”


콘텐츠와 장소를 연결짓는 검색엔진

걸어서 5분 이내…원하는 모든 걸 찾아준다

이거다.

가게 상호명으로 장소검색을 하는 건 전혀 어렵지 않다. 그러나 특히 잘 모르는 동네에 갈 때 장소를 찾기 위한 검색어를 입력할 땐 난감한 경우가 많다. 볼펜심을 갑자기 사야 하는데 볼펜심을 파는 곳이 이 근처 어디에 있는지 찾기 어렵다. 순두부찌개를 먹고 싶지만 순두부찌개 전문점이 아닌 이상 마땅한 식당 찾기가 쉽지 않다. 문구점이나 편의점 이름에 볼펜이 들어간 경우도 없고 순두부 전문점을 제외하곤 상세메뉴가 음식점 이름에 들어가지도 않기 때문이다.

할로윈 물품을 찾겠다고 할로윈을 검색하면 할로윈 축제, 할로윈 의상들이 잔뜩 나와 결국 수많은 페이지에 들어가서 누군가가 남긴 방문기를 읽어보거나 직접 발품을 팔아서 돌아다녀야 한다.

일본의 한 스타트업인 트라이트루찾는 대상이 상호명, 업종명이 아니라 구체적인 상품 장르일 때도 검색이 되는 공간 검색 엔진 ‘패시’를 개발 중이다. 패시는 인터넷 정보를 장소와 연관 지어 찾아주는 검색 서비스다. 현재 일본어로 쓰인 2억 페이지를 크롤링해 URL 패턴은 물론 어느 지리 관련 정보를 포함하고 있는지 등을 판단한다. 이런 판단에는 머신러닝을 이용해 70% 가량 정확도로 판단할 수 있다고 한다.

서비스 테스트 결과 반응은 폭발적이었다. 현재까지 월간 활성 사용자 수가 100만 명을 넘었다. 이에 트라이트루는 수익모델을 고민하고 있는데 광고 요금에 따라 매장 노출 순서를 바꾸는 게 아니라 상품명과 이를 살 수 있는 매장을 하나로 묶는 수익화 방법을 고려 중이다.


데이터를 바라보는 관점

“쓰레기 데이터라는 것은 없다”

과거에는 주로 트랜잭션 데이터(거래 데이터) 중심으로 필요한 데이터만 사용했다면, 이젠 과거 쓰레기라고 여겨졌던 나머지 모든 데이터를 활용해서 새로운 가치를 찾아내는 방향으로 추세가 바뀌고 있다.

과거엔 중요하다고 생각되는 일부 데이터만 써싸면, 이젠 과거에 쓰레기라고 생각해 버렸던 데이터도 다 활용하게 될 것이다.


Hyeyeon

A Blog about E-Commerce and Product Management

comments powered by Disqus

    rss facebook twitter github youtube mail spotify instagram linkedin google google-plus pinterest medium vimeo stackoverflow reddit quora