웹 데이터 분석의 트랜드는 웹 사이트의 히트수 -> 페이지 뷰 -> 방문 수 -> 전환율 로 변화하고 있다. 측정 지표란 웹사이트상의 트렌드나 이벤트를 묘사하는 통계학상의 양적 측면을 의미하고, KPI는 목표를 어느 정도 달성하고 있는지를 알 수 있게 해주는 측정지표다.
1. 방문
방문은 누군가가 웹 사이트를 방문했고, 떠나기 전에 얼마간의 시간을 보냈다는 걸 의미한다. 기술적으로 방문자 경험은 세션이라고 부른다. 세션은 보통 방문이라고 불린다. 세션들은 보통 웹 사이트에 있는 누군가의 요청 모음이다.
1) 누군가 웹 사이트의 첫 번째 페이지나 아이템을 요청, 웹 데이터 분석 도구는 사용자에 대한 세션을 시작
2) 방문자에게서 오는 모든 추가적인 요청은 개별 세션 ID에 덧붙여짐
3) 방문자가 사이트를 떠나면, 개별 세션 ID는 방문한 페이지를 하나의 단일한 방문으로 묶는데 쓰임
4) 웹 데이터 분석 도구에서 특정 기간에 대한 리포트를 보면, 전체 방문 수는 특정 기간 동안의 모든 세션 수를 더한 것이 됨.
최초 요청에서 마지막 요청까지 지속으로 정의됨.
2. 개별방문자
개별 방문자는 어림잡아서 계산한다.
1) 누군가 웹 사이트의 첫 번쨰 페이지나 아이템을 요청, 웹 데이터 분석 도구는 사용자에 개별 쿠키를 설정
2) 쿠키는 방문자가 떠난 후에도 남아 있음
3) 브라우저를 통해 웹 사이트를 누군가 방문하면, 지속되는 쿠키는 똑같은 브라우저에서 들어온 것을 인식
4) 개별 방문자 측정 지표는 주어진 시간 동안 지속되는 개별 쿠키 ID 수의 합을 말함
개별 방문자는 러프한 값이며, 완벽하지 않다. 하지만 개별 방문자는 사이트를 방문하는 사람의 수를 헤아릴 수 있는 가장 좋은 지표가 될 것이다.
많은 웹 분석 도구에서는 일일 개별 방문자, 주간 개별 방문자, 월간 개별 방문자, 가끔은 절대 개별 방문자 라는 측정 지표를 볼 수 있다. 다음의 표로 각각 지표를 계산해 보자
월 |
주 |
일 |
방문자 |
||
7월 |
1 |
월 |
A |
B |
C |
7월 |
1 |
화 |
B |
C |
B |
7월 |
1 |
수 |
C |
C |
|
7월 |
2 |
월 |
C |
D |
|
7월 | 2 | 화 | D | E | |
7월 |
3 |
월 |
E | A | F |
8월 |
1 |
월 |
E | A |
F |
G | H | I |
7월 1주 월요일의 일일 개별 방문자:3, 주간 개별 방문자:3, 월간 개별 방문자:3, 절대 개별 방문자:3
7월 1주 화요일의 일일 개별 방문자:5, 주간 개별 방문자:3, 월간 개별 방문자:3, 절대 개별 방문자:3
-> 일일 개별 방문자는 화요일에는 화요일만의 개별 방문자수가 더해진다. 따라서 일일 개별 방문자는 하루 이상의 기간을 보고 있을 때는 무의미한 숫자가 된다.
7월 1주 수요일의 일일 개별 방문자:6, 주간 개별 방문자:3, 월간 개별 방문자:3, 절대 개별 방문자:3
7월 2주 화요일의 일일 개별 방문자:10, 주간 개별 방문자:6, 월간 개별 방문자:5, 절대 개별 방문자:5
-> 일일 개별 방문자와 마찮가지로, 주간 개별 방문자는 여러 주를 한꺼번에 보는 경우에는 소용없다.
7월 3주 월요일의 일일 개별 방문자:13, 주간 개별 방문자:9, 월간 개별 방문자:6, 절대 개별 방문자:6
8월 1주 월요일의 일일 개별 방문자:19, 주간 개별 방문자:12, 월간 개별 방문자: 12,절대 개별 방문자: 9
위에 카운트에 보이는 것처럼 개별 방문자수는 기간에 있어서 중복을 제거해야 의미가 있다. (즉 특정 기간의 개별 방문자수 카운트)
3. 페이지 체류 시간
페이지 체류 시간은 개별 페이지와 사이트에서 방문자가 머문 시간을 측정한다. 페이지 체류 시간은 측정이 복잡하다. 다음의 페이지 방문 시나리오를 생각해 보자
여기에서 개별 페이지 체류 시간은 홈페이지:1분, 페이지2:4분, 페이지3:0분 이 된다. 페이지3에서 이탈할 경우 머무른 시간은 실제 측정이 불가능하다. 하나의 페이지만 보고 이탈 한 경우에는 체류 시간이 0이 된다.
마지막 페이지 체류 시간을 측정하기 위해서는 자바스크립트의 코드를 심어서 브라우저에서 unloaded 될 경우에 발생하는 onbeforeunload 이벤트를 캐치해서 시간을 기록하는 것이다.
멀티텝으로 페이지를 네비게이션 하는 경우는 정규화해서 계산하면 된다. 즉 다음의 예는
다음처럼 정규화해서 계산하면 된다.
많은 비지니스에서 체류 시간은 핵심적인 지표이다.
4. 반송률(Bounce Rate)
반송률은 웹사이트 방문자 세션 가운데 오직 한 페이지만 지속된 비율이다. 이 지표의 의미는 웹사이트를 방문하고 실망해서 나갔다는 것이다. 일반적으로 전체 사이트 수준의 합계 측정과, 최상위 진입 페이지에 대한 반송률 측정이 필요하다.
5. 이탈률(Exit Rate)
얼마나 많은 사람들이 웹사이트의 특정 페이지를 떠났는가를 측정하는 것이다. 이탈률이 사이트에 좋은 것인지 나쁜 것인지는 파악하기 어렵다. 정보 조회를 위해서 들어온 경우라면 이탈률은 정보 조회가 마쳤음을 또는 원하는 정보를 찾지 못했음을 의미할 수 있다. 반송률은 확실히 나쁜 이탈이 된다. 이탈률은 사이트에서 들어와서 특정 페이지에서 이탈한 비율이고, 반송률은 특정 페이지에 들어와서 아무것도 안하고 나간 것이다.
6. 전환률(Conversion Rate)
퍼센트로 표현되는 전환율은 원하는 결과를 개별 방문자로 나눈 것으로 정의한다.
7. 인게이지먼트(Engagement)
인게이지먼트는 호의적인 관심 또는 흥미를 이끌어 내는 것이다. 이것을 측정하기는 매우 어렵다. 어떤 사이트를 반복적으로 방문한다고 하였을때, 이를 호기심이 있어서 방문하는 것과 원하는 정보를 찾기 어려워서 사이트를 헤매는 것과 어떻게 구별할 것인가. 사이트 체류 시간, 사이트 등록, RSS피드, 뉴스레터 구독 신청, 댓글 남기기, 컨텐츠 다운로드 등은 인게이지먼트의 정도를 더 잘 표현해 준다. 또는 웹 사이트를 나갈때 출구 설문 조사를 해보는 것도 측정할수 있는 방법중 하나가 된다.
하지만 순수한 클릭스트림으로 인게이지먼트를 측정하기는 쉽지 않다.
Reference
웹데이터분석학, 아바나쉬 카우쉭 지음, 에이콘출판, 2013년 5월 31일 출간