이커머스를 위한 데이터 분석 솔루션 (구글 애널리틱스 외)

이커머스를 위한 데이터 분석 솔루션 (구글 애널리틱스 외)

Summary:

웹 분석 툴에 대해 알아봅니다.


웹 로그 분석 툴은 웹사이트를 운영하는 데 필수가 됐다. 단순 방문자수 통계를 위한 프로그램을 넘어서서, 캠페인의 성공 정도를 측정하고 레퍼럴 트래픽 데이터를 분석함으로써 방문자 행동 패턴을 추적하는 데 큰 도움을 주고 있다. 분석 솔루션은 웹사이트 분석, 이메일 마케팅 분석, 소셜미디어 분석 카테고리로 나눠 구분할 수 있다. 웹사이트 분석에는 구글 애널리틱스와 키스메트릭스가 대표적이고 이메일 마케팅 분석에는 마케토, 메일침프, 포스트맨, 소설미디어 분석에는 훗스윗, 빅풋9이 있다.

각 툴에 대한 자세한 소개는 이 곳에 설명되어 있다.


구글 애널리틱스

오늘은 많은 툴 중에서도 내가 지금 이용하고 있는 구글 애널리틱스를 시작하기 위한 기초 용어에 대해 얘기해보고자 한다.

출처: Google Analytics 공식 블로그


1. 쿠키(Cookie)

쿠키는 사용자의 웹 사이트 활동 내역을 별도로 저장해 놓은 파일이다. 사용자의 브라우저에 저장되며 대부분의 쿠키에는 쿠키 ID라는 고유 식별자가 포함되어 웹사이트와 서버는 서로 다른 쿠키가 저장된 브라우저를 구분하고 고유한 쿠키 ID를 통해 각 브라우저를 인식할 수 있다.

사용자가 웹사이트에서 쇼핑할 때 웹사이트는 쿠키를 통해 온라인 장바구니에 추가된 항목을 기억할 수 있다. 그래서 사용자가 로그인하지 않았음에도 다음 번 방문 시 쿠키를 통해 온라인 장바구니에 추가된 항목을 기억하여 그대로 표시할 수 있다. 쿠키는 페이지의 월간 순 방문자수와 같은 사용자 활동에 관한 데이터 수집에도 이용된다.

2. 사용자(User)

구글 애널리틱스가 브라우저를 통해 접속한 개인에게 부여하는 고유의 아이디는 개인이 쿠키를 지우지 않는 한 유지되고 재방문 등을 알려주는 역할을 한다. GA는 단일 쿠키를 ‘사용자’로 인식하기 때문에 사람 한 명이 두 개의 다른 브라우저로 사이트에 접속할 경우 구글 애널리틱스는 사용자를 2명으로 인식하게 된다. 사용자는 몇 년 전 ‘방문자(Visitor)’에서 용어가 바뀐 것이기 때문에 사용자와 방문자는 같은 뜻이라고 생각해도 된다.

단, 사용자 개념에 GA의 큰 취약점이 있다. 모바일 앱은 쿠키가 없다. 구글 애널리틱스는 쿠키 기반이다. 모바일 앱은 운영체제에 따라 추적 가능여부가 다르기 때문에 사용자 데이터 측정에 한계가 있다.

3. 세션(Session)

세션은 사용자가 접속한 이후 여러 페이지를 돌아다니며 한 어떤 특별한 행동의 집합이다. 쉽게 말해 사이트에서 사용자가 취한 행동의 집합인데 사이트를 이탈했다고 판단하는 기준은 크게 3가지로 나뉜다. 30분 동안 아무런 행위가 일어나지 않아 세션이 끊긴 경우, 오전 0시가 되어 세션이 끊긴 경우, 사이트 유입경로가 바뀐 경우가 그것이다.

4. 방문(Entrance)

방문은 사용자가 방문하여 웹사이트를 이탈하기까지의 행위를 하나의 단위로 묶은 개념이다. 세션의 첫 번째 페이지뷰 또는 화면 조회와 함께 누적되기 시작한다. 반대로 세션수는 조회유형에 관게없이 세션의 첫 번째 조회와 함께 누적되기 시작하므로 두 수치에 대해 차이가 날 수 있다.

5. 전환(Conversion)

전환은 사이트 내에서 완료된 활동으로, 기획자나 디자이너 또는 마케터의 의도대로 얼마나 많은 사용자가 목표에 달성했는지를 나타낸다.

6. 페이지뷰(Page View)

페이지뷰(PV)는 GA 추적코드로 추적되는 사이트에서 발생한 페이지 조회를 의미한다. 즉 사이트 접속 시 구글 애널리틱스 코드가 읽히면 페이지뷰수는 1로 카운트되고 로딩되지 않을 경우 카운트되지 않는다. 페이지뷰는 사용자를 구별하고 있지 않기 떄문에 동일 사용자가 새로고침을 5번 누르면 PV는 5로 집계된다.

7. 순 페이지뷰(Unique Page View)

순 페이지뷰는 동일한 세션에서 동일한 사용자가 발생시킨 페이지뷰를 통합 집계한 것이다. 페이지가 한 번 이상 조회된 세션수를 나타낸다. 페이지뷰는 수집된 값이고 순 페이지뷰는 PV가 처리된 값이라는 점에서 다르다. 순 페이지뷰는 PV에서 각 단일 페이지에서 집계된 최초 1회의 PV를 제외한 나머지 PV를 제거한 수이다. 나머지 PV를 제거하는 과정을 처리(Processing)이라고 한다.

8. 이탈률(Bounce Rate)

이탈(bounce)은 사용자가 최초 접속한 페이지에서 세션이 아무런 상호작용 없이 세션이 만료된 경우를 뜻한다. 이탈률은 그 rate다. 직역하면 ‘반송된 혹은 튕겨나간 확률’이다. 반송은 해당 페이지로 들어왔다가 그 페이지에서 사이트 접속을 종료한 확률, 즉 유입과 종료가 동일 페이지에서 발생한 경우를 말한다. 이 때 ‘이탈률’이라는 표현을 쓴다. 서비스의 메인 페이지나 랜딩 페이지(검색엔진, 광고 등을 경유하여 접속하는 유저가 최초로 보게 되는 웹페이지)의 이탈률이 높으면 페이지 개선이 시급하다.

9. 이탈률%(Exit Rate)

이탈(bounce가 아닌 exit)은 마지막 상호작용 이후 사용자의 세션이 만료된 경우를 뜻한다. 이탈률%는 그 rate다. 직역하면 ‘나간 혹은 종료 확률’이다. 이탈률%는 이탈률과 달리 유입과 종료가 다른 페이지에서 일어난 경우에 해당한다. 마케팅 이벤트 응모 페이지라면 이탈률%이 높을수록 좋다.

팁!

이탈률과 이탈률%의 차이, 문제와 해결책은 제대로 된 구글 애널리틱스 정리 - 용어편 #4에 자세히 설명되어 있다. 꼭 읽어보자.

10. 세그먼트(Segment)

세그먼트는 공통의 속성을 공유하는 세션 또는 사용자 집합이다. 사용자를 구분하면 보다 효과적으로 분석을 수행할 수 있다. 특정 국가나 도시, 특정 제품을 구매한 사용자, 특정 사이트를 방문한 사용자 등 다양한 하위집합으로 생성할 수 있다.

세그먼트는 중요하다. 웹로그분석의 왜곡을 줄이기 위해서다. 세분화되지 않은 데이터는 전반적인 흐름, 숲을 보는 데 용이하지만 세부적으로 쪼개봤을 때 오류를 불러올 수 있다. 이를 대변하는 것이 ‘심슨 패러독스’다. A병원과 B병원의 전체 암환자 생존률을 파악했을 땐 B병원의 확률이 높아 B병원을 우수하다고 평가할 수 있지만, 데이터 세그먼트를 수행하여 위암 환자에 한해 생존률을 구할지, 대장암 환자에 한해 생존률을 구할 지에 따라 A병원과 B병원의 생존률이 달라져 분류 항목에 따라 A, B의 평가 순위가 달라진다는 것이다.

해결하고자 하는 문제 또는 파악하고 싶은 현상에 맞춰 최대한 데이터를 세분화하는 것이 필요하다. 구글 애널리틱스는 다양한 분류 기준을 제공하고 있으며 이를 활용하는 것은 기획자의 몫이다.

위에서 살펴본 세션, 사용자수, 세그먼트, 이탈률 등이 표시되어 있다.


구글 애널리틱스의 코호트 분석

토스의 프로덕트 디자이너 남영철 님께서 디자인 테이블에서 말씀하신 부분이기도 하다. 기획자든 디자이너든 항상 지니고 있어야 하는 궁금증은 ‘이 제품이 내가 설계한 의도대로 성공했는지에 대해 어떻게 물어봐야 할까? 어떤 지표를 써야 성공 여부를 판단할 수 있을까?‘다.

서비스 출시 초기엔 유저 수의 성장에 집중할 것이다. 유저 수가 증가한다면 서비스가 잘 되고 있는 것이고 사용자가 늘어나지 않으면 문제가 있다. 여기에 질문을 덧대자면, 그 유저 수를 판단하는 지표가 무엇이냐는 것이다. 이탈률에 관계없이 신규 유저를 계속적으로 불러들이면서 유저수가 성장할 수 있고 신규 유저가 재방문하면서 유저수가 성장할 수도 있다. 이 때 사용 유지율이라는 지표에 집중한다면 우리 사이트에 도움이 될 만한 유저가 성장하는지 그 여부를 판단할 수 있다.

거액의 광고 또는 이슈거리로 신규 사용자를 대량으로 유입시키는 것은 돈만 많으면 어렵지 않다. 하지만 이건 밑 빠진 독에 물을 붓는 꼴이다. 서비스를 한 번 쓴 사람이 다시 찾지 않으면 투자비는 증발해버린다. 이게 지속 가능하려면 독의 구멍을 작게 만들어야 하고 구멍이 작아졌는지의 여부는 리텐션을 측정함으로써 검증한다.

Google Analytics에서 제공하는 Retention 그래프

코호트 분석은 리텐션을 파악하는 수단이 된다. 이번주에 가입한 사용자가 다음주에 얼마나 남는지, 이번 업데이트 후에 사용자가 덜 떨어져나가는지를 확인할 수 있다. 예를 들어 서비스 개선 전 100명이 유입하고 40명이 다음주가 되어도 남아있었는데 업데이트 후 100명 중 50명이 유지되었다면 이번 개선이 성공적이었다고 볼 수 있다.

코호트 지표를 통해 사용자 유지가 어느 정도 안정화되면 활성화율을 살펴본다. 해당 서비스를 실제로 잘 쓰게 되었나를 판단하는 지표인데 앱 설치부터 목표를 달성하기까지 어느 퍼널에서 이탈이 있었는지를 파악하면 무슨 요소를 고쳐야 할 지 보인다. 첫 화면의 가이드 부분을 개편해보자 한 들 통과율이 99%라면 개선이 시간 낭비다. 구글 애널리틱스의 지표를 기반으로 무엇을 하는 게 옳은 지 아는 것이 중요하다.

앱이나 웹사이트에 계속 새로운 기능을 추가하거나 개선하는 경우, 이 코호트 분석은 특히 유용합니다. 예를 들어, 마케팅 비용을 들여서 광고를 실시했다면 당연히 트래픽이 늘어날 것이고, 결과적으로 사용자수 또는 그 결과로 매출이 증가할 것입니다. 그렇지만 이것이 반드시 웹(앱)서비스의 기능이 좋아졌다는 것을 의미하지는 않습니다. 많은 리소스를 투입하여 서비스를 개선하고 있지만 정말로 사용자가 원하는 방향으로 개선이 이루어졌는지 알 수는 없다는 겁니다. 이런 경우 특정 기능이 추가되기 전과 추가된 후의 코호트 분석을 보면 유용한 인사이트를 얻을 수 있습니다. 매일 매일 새로운 기능을 추가하고 있다면 일별 코호트 분석을 통해 유지율을 살펴보는 것이 중요합니다.

콘텐타, Contenta M


더 알아보기

오늘 밤부터 쓰는 google analytics (구글 애널리틱스, GA) from Yongho Ha


Hyeyeon

A Blog about E-Commerce and Product Management

comments powered by Disqus

    rss facebook twitter github youtube mail spotify instagram linkedin google google-plus pinterest medium vimeo stackoverflow reddit quora