<문제>

참 또는 거짓: 새 보기를 만들 경우 같은 속성에서 처음에 만든 보기의 이전 데이터도 새 보기에 표시됩니다.


A. 참. 새 보기에는 이전 웹사이트 데이터가 모두 포함됩니다.

B. 거짓. 보기는 생성된 날부터 데이터를 보고합니다.


<풀이>


<문제>

사용자 ID 기능을 이용하면 여러 기기 및 다양한 세션에서 발생한 참여 데이터와 고유 ID를 연결할 수 있습니다. 애널리틱스에서 사용자 ID 기능을 사용하기 위한 전제 조건은 무엇입니까?


A. 애널리틱스 추적에 구글 태그 관리자를 사용해야함

B. 고유 ID를 직접 생성할 수 있어야 함

C. 사용자 ID 보고서를 위한 신규 애널리틱스 계정을 만들어야 함

D. 모두 정답


<풀이>


<문제>

다음 중 사용자 ID 기능이 일반적으로 사용되는 웹사이트 시나리오는 무엇입니까?


A. 사용자가 웹사이트에서 계정을 만들고 모든 유형의 기기에서 로그인할 수 있음

B. 사용자가 하나의 세션 내에서 웹사이트와 여러 하위 도메인 사이를 이동할 수 있음

C. 사용자가 구매를 완료하기 위해 타사 장바구니 도메인으로 이동해야 함

D. iFrame을 통해 다른 도메인에 표시되는 콘텐츠가 있음


<풀이>


<문제>

Google 애널리틱스에서 두 세션이 동일한 사용자에게서 발생한 것임을 확인할 수 있는 경우는 언제입니까?


A. 세션이 동일한 기기와 동일한 브라우저에서 발생하는 경우

B. 세션이 같은 날 발생하는 경우

C. 세션이 동일한 브라우저에서 발생하는 경우

D. 세션 간 발생 시간이 30분 미만인 경우


<풀이>

Posted by 값진인생
,

GAIQ 인증 기간이 만료되어 재시험을 치뤘습니다. 결과는 불합격. 문제가 꽤 바뀌고 어려워졌네요. 다중 채널 유입경로, 애드워즈 관련 문제 많아진 것 같습니다.

기출 문제를 올려도 되는지 모르겠지만, 별도의 저작권 표기가 없어 올려 봅니다.

참고로 정답은 올리지 않을 예정입니다. 공부니까요.


<문제>

참 또는 거짓. analytics.js에 추적 코드를 업데이트한 경우 하위 도메인을 추적하기 위한 추가 구성은 필요하지 않습니다.


A. . analytics.js를 사용하면 추가 구성 없이 도메인 및 하위 도메인을 추적할 수 있습니다.

B. 거짓. 하위 도메인을 추적하려면 항상 교차 도메인 추적을 설정해야 합니다.

 

<풀이> 


<문제>

다음 중 Google 애널리틱스에서 추적하는 조회 유형은 무엇입니까?


A. 페이지 추적 조회

B. 이벤트 추적 조회

C. 전자상거래 추적 조회

D. 모두 정답

<풀이>


<문제>

Q. 측정 프로토콜은 조회수를 수집해 Google 애널리틱스로 전송하기 위한 표준 규칙 집합입니다. 측정 프로토콜의 기능은 무엇입니까?


A. 웹에 연결된 기기에서 Google 애널리틱스로 데이터 전송

B. 키오스크 또는 판매 시점 시스템에서 Google 애널리틱스로 데이터 전송

C. 수집된 데이터 표를 Google 애널리틱스로 업로드

D. A B만 정답

E. A, B, C 모두 정답

 

<풀이>


Posted by 값진인생
,

보고서를 작성하다 보면 많은 차트가 필요합니다. 대부분은 기본 기능으로 가능하지만, 색다른 차트가 필요한 때가 있죠.

최근에 구성비를 표현해야 하는데 엑셀에는 모자이크 차트(Mosaic Chart 또는 Mosaic Plot)이 없었습니다. 모자이크 차트는 아래처럼 구성비에 따라 면적이 달라지는 차트입니다. 얼핏 세로 누적 차트와 같지만, 각 칼럼의 폭이 다른 것을 알 수 있습니다.


구글링을 해 보니 R이나 다른 차트 프로그램을 써야 하더군요. 차트 하나 그리자고 새로운 프로그램을 쓰기도 그렇고, R은 요즘 공부하고 있지만, 손에 익지 않고, 고민하다 한 블로그에서 엑셀 VBA로 만든 것을 봤습니다.

간단한 기능은 VBA로 비슷하게 만드는 재주는 있어 따라 해 봤습니다.


혹시 필요한 분이 있을지 몰라 올려 놓습니다. 


20150331_Mosaic Chart.xlsm


사용법은 행 갯수, 열 갯수, 차트 높이, 폭, 표현할 데이터, 숫자 형식을 정하고 데이터를 입력합니다. 그리고 "Plot" 클릭, 완성된 차트를 확인하고 "Select & Copy" 클릭. 파워포인트에 붙여넣기. 끝입니다.

(Select & Copy 버튼을 누르면 모든 도형을 그룹으로 묶고, 클립보드에 복사합니다)


Row에 배경색 넣기나, 폰트 변경은 완성된 차트에서 하지 마시고 아래 보는 것처럼 셀서식을 변경 후 "Plot"을 다시 클릭하세요. 도형이 많아지니 클릭해서 선택하는 것도 일이 더군요.  



뭐 제가 쓰기에 불편한 점이 없다면 업데이트는 예정에 없습니다. ^^


'PowerPoint' 카테고리의 다른 글

색상 조합이 어려울 때  (0) 2015.01.05
Posted by 값진인생
,

One Sample T-Test

통계 2015. 2. 3. 20:39

필요할 때 찾아보고, 쓰고 나서 잊어 버려 실무에서 사용하는 통계에 대해 정리해 놓으려 합니다. 저도 통계 전문가는 아니라 R을 배우면서 겸사 겸사 이용법 위주입니다.


집단 간 차이가 있는 알아 보기 위해 가장 많이 이용하는 분석이 T-Test인데요. 일반적으로 T-Test라고 하면 Student's t-Test를 말합니다. 세부적으로는 단일 집단의 평균이 특정 값(모집단의 평균)과 차이가 있는지 검정하는 One Sample T-Test와 두 집단 간 평균의 차이가 있는 검정하는 Two Sample T-Test를 많이 이용합니다. 또 하나는 한 집단을 대상으로 사전-사후 차이를 검정하는 Paired T-Test가 있습니다.


T-Test에 앞서 정규성 검정을 하는데요. 표본의 크기가 30보다 크면 정규성을 있다고 가정하기도 하는 것 같습니다. (중심극한정리 어쩌구...) 하지만 정규분포를 따르지 않는 경우에는 비모수 검정이 있기 때문에 굳이 정규분포를 따르지 않는 자료를 T-Test할 필요도 없을 것 같습니다.(R에서 wilcox.test 입니다. 나중에 다시 정리하지요.)


One Sample T-Test


가정: 분석 대상 데이터는 정규 분포를 따른다.


R 명령어: t.test(변수명, mu=모집단의 평균, alternative=검정방법)


예) 1부터 10사이의 10개 데이터의 평균 6이 모집단의 평균 5와 차이가 있는지 검정합니다.


귀무가설: x의 평균은 5이다.

대립가설1: x의 평균은 5가 아니다 (양측검정)

대립가설2: x의 평균은 5보다 작다 (단측검정)

대립가설3: x의 평균은 5보다 크다 (단측검정)


; 샘플 데이터를 만듭니다.

> x <- c(1,3,4,5,6,7,7,8,9,10)


; x의 기본 통계량 확인

; x의 산술평균은 6입니다.

> summary(x)

Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 

1.00    4.25    6.50    6.00    7.75   10.00 


; x가 정규분포를 따르는지 검정합니다.

; p-value가 0.05보다 크므로 정규 분포를 따른다는 귀무가설을 기각할 수 없습니다.

; 만약, p-value가 0.05보다 같거나 작다면 비모수 검정을 실시합니다.

> shapiro.test(x)

Shapiro-Wilk normality test


data:  x

W = 0.9795, p-value = 0.9623


; 먼저 대립가설1을 검정해 봅니다. 

; 기본적으로 t.test는 양측검정을 실시합니다. alternative="two.sided" 생략 가능.

; 평균이 1 차이가 있지만, 통계적으로 유의하지 않습니다. 

; 만약 표본이 더 많았다면 차이 있는 것으로 나올 수도 있습니다.


> t.test(x, mu=5, alternative="two.sided")

One Sample t-test


data:  x

t = 1.1339, df = 9, p-value = 0.2861

alternative hypothesis: true mean is not equal to 5

95 percent confidence interval:

 4.004965 7.995035

sample estimates:

mean of x 

        6


; 대립가설2 검정입니다.

; 역시 평균의 차이가 유의하지 않게 나왔습니다.

> t.test(x, mu=5, alternative = "less")

One Sample t-test


data:  x

t = 1.1339, df = 9, p-value = 0.8569

alternative hypothesis: true mean is less than 5

95 percent confidence interval:

     -Inf 7.616654

sample estimates:

mean of x 

        6 


; 그럼 대립가설3도 해보지요.

; 귀무가설을 기각하지 못했습니다.

> t.test(x, mu=5, alternative = "greater")

One Sample t-test


data:  x

t = 1.1339, df = 9, p-value = 0.1431

alternative hypothesis: true mean is greater than 5

95 percent confidence interval:

 4.383346      Inf

sample estimates:

mean of x 

        6 


; 결과를 자세히 보신 분은 양측검정과 단측검정의 신뢰구간이 달라진 것을 보셨을 겁니다.

; 말 그대로 단측검정은 한 쪽 방향으로만 검정하기 때문에 같은 95% 유의수준에서도 신뢰구간이 달라지게 됩니다.

; 만약 유의수준을 변경하고 싶다면 아래와 같이 지정합니다.

> t.test(x, mu=90, conf.level=0.90)

One Sample t-test


data:  x

t = 1.1339, df = 9, p-value = 0.2861

alternative hypothesis: true mean is not equal to 5

90 percent confidence interval:

 4.383346 7.616654

sample estimates:

mean of x 

        6 


샘플 데이터를 대충 만들었더니 재미 없는 해설이 되었네요.

책 쓰시는 분들은 샘플 데이터 만드는 것도 일이겠어요.


현업에서는 이번 실시한 캠페인의 효과가 기존의 평균적인 성과와 차이가 있는지 검정한다거나... 에구 예로 들만한 것이 언뜻 떠오르지 않네요. 현업에서는 별로 쓰이지 않는 것으로... ㅜㅜ


다음에 다룰 two sample t-test는 꽤 쓰인다는...


Posted by 값진인생
,

좀 더 편하게 로그 분석을 할 수 있는 방법을 찾다가 어느 블로그에서 발견한 것입니다. 소스만 복사해 놓은 거라... 원문을 쓰신 분 죄송합니다.


우선, 구글 API를 이용할 수 있도록 합니다. 자세한 사항은 구글링 참조

1) Google Developers Console 가입 

2) Analytics API 사용 등록

3) API 및 인증 메뉴 → 사용자 인증 정보 메뉴에서 "새 클라이언트 ID 만들기"


R코드는 아래 처럼 인증 → 가져올 데이터 정의 → 데이터 가져오기 → 분석 순으로 작성됩니다. 이를 응용하면 반복되는 분석을 자동화하는데 큰 도움이 될 것 같습니다. 그런데 R을 잘 모른다는 것이 함정 ㅜㅜ


library(RGoogleAnalytics)

library(ggplot2)

library(magrittr)

library(dplyr)

library(lubridate)

library(xts)


; 새로 만들거나 기존의 클라이언트 ID와 클라이언트 비밀 보안 입력

token <- Auth(client.id = "XXXXXXX.apps.googleusercontent.com", client.secret = "XXXXXXX")

save(token,file="./token_file")

load("./token_file")

ValidateToken(token)


; 데이터를 가져올 보기의 번호 입력(table.id는 구글 애널리틱스 → 보기 → 설정에서 볼 수 있습니다.

query.list <- Init(start.date = "2014-12-01",

                   end.date = "2014-12-31",

                   dimensions = "ga:date",

                   metrics = "ga:users,ga:pageviews",

                   max.results = 10000,

                   sort = "-ga:users",

                   table.id = "ga:XXXXXXXX")

ga.query <- QueryBuilder(query.list)                   

ga.data <- GetReportData(ga.query, token)


; 분석에 맞게 데이터를 작성합니다. 아래는 요일변수를 만드는 예입니다.

ga.data <- ga.data %>% mutate(weekdays=factor(weekdays(as.Date(date, "%Y%m%d")), levels = c("일요일", "월요일", "화요일", "수요일", "목요일","금요일", "토요일")))


; 분석 결과를 시각화 합니다.

ga.data %>% data.frame %>% group_by(weekdays) %>% summarise(wdsums=sum(users)) %>% ggplot(aes(weekdays, wdsums)) + geom_bar(aes(fill=weekdays),stat="identity")

Posted by 값진인생
,

파워포인트 테마 색뿐만 아니라 간단한 차트를 만들 때도 유용한 사이트입니다. 개인적으로 알록달록한 원색보다 한 색으로 농담을 달리한 색을 좋아해 이용하고 있습니다. 미려하고 흑백으로 볼 때 가독성 높은 색을 빠르게 선택할 수 있습니다. 선택이 어려울 때는 바깥쪽 원에서 색깔만 고르고 PRESETS 탭을 누르면 추천 조합을 볼 수 있습니다. 


http://paletton.com




이렇게 고른 색으로 파워포인트 테마 색을 만들면 통일성 있고, 고급스러운(?) 슬라이드를 만들 수 있습니다.

 


'PowerPoint' 카테고리의 다른 글

엑셀에 없는 차트 - 모자이크 차트(Mosaic Chart)  (0) 2015.03.31
Posted by 값진인생
,

구글 애널리틱스의 여러 기능을 테스트하기 위해 이것 저것 만지다 티스토리 블로그는 내부 검색어를 어떻게 분석하는지 궁금했습니다.

애널리틱스 도움말에는 검색어를 GET 방식 처리하는 경우에 대해 설명이 있고 POST 방식인 경우 웹 프로그램을 수정하거나 추적코드를 수정해야 한다고 나와있습니다.애널리닉스 도움말


당연히 티스토리 프로그램을 수정할 수도 없고, 추적코드를 수정하는 것도 어려워 보여 포기하려던 참에 꼼수가 하나 생각났습니다.


필터 기능을 이용해 URL을 변경하는 방법입니다. 

티스토리 블로그 검색창에 검색어를 입력하고 검색 버튼을 누르면 아래와 같이 URL이 표시됩니다. 


http://fromdata.tistory.com/search/검색어

이것을


http://fromdata.tistory.com/search?q=검색어

로 변경하는 것이죠.


결론적으로 위 방법은 실패했습니다. 

결과 내부 검색어는 보고서 -> 방문형태 -> 사이트 콘텐츠 -> 콘텐트 드릴다운으로 봐야겠습니다.


그래도 필터 설정에 대해서는 배웠네요. ^^;

제가 한 삽질(필터 설정)을 아래에 있습니다.







Posted by 값진인생
,

웹 로그 분석을 위해 구글에서 "구글 애널리틱스"라는 툴을 무료 제공하고 있습니다. 저도 관련된 업무를 맞으면서 처음 알게되었습니다. 사실 이 블로그도 구글 애널리틱스를 적용해 보기 위해 개설 했습니다. 페이지 소스를 보시면 구글 태그 매니저 스니펫을 확인할 수 있습니다. 구글 태그 매니저는 좀 더 자세히 알아 보겠습니다.


구글 애널리틱스에 대해 검색하면 GAIQ 또는 구글 애널리틱스 인증에 대한 글 들이 있는데 오래전 자료라 현재와 다른 점들이 있습니다.


첫째 인증 시험은 Google Testing Center가 아니라 구글 파트너에서 볼 수 있습니다.

둘째 응시료는 50달러가 아니라 무료 입니다.

셋째 시험문제는 영어가 아니라 한글로 출제됩니다.(언어 선택 가능)


시험 공부를 하는데 마땅한 자료가 없어 주로 구글 애널리틱스 도움말과 에이콘 출판사에서 나온 "(개정판) 구글 애널리틱스"(브라이언 클리프튼)를 일독 했습니다. 국내에는 관련 서적이 매우 부족하네요. 이 책도 구버전을 기준으로 작성되었습니다. 현재는 구글 애널리틱스는 유니버설 애널리틱스로 업그레이드 되었습니다.


시험은 크게 어렵지 않고, 주로 애널리틱스 개념에 대한 문제가 많이 출제됩니다. 측정항목, 측정기준, 보고서 등 애널리틱스에서 사용하는 용어의 뜻을 익히면 유추 가능한 문제들입니다. (그리고 떨어져도 일주일 후 다시 응시가 가능해 응시하는 것 자체가 공부가 됩니다. 저도 두번째 응시에 합격했어요. ^^)


저는 합격 자체보다 업무에 필요한 도구를 익힌다는 생각으로 대하고 있습니다.



Posted by 값진인생
,

Google 애널리틱스 인증 시험은 구글 파트너 사이트(https://www.google.com/partners/)에서 볼 수 있습니다. 당연히 구글 계정이 있어야 합니다. 로그인 후 인증 -> 애널리틱스 메뉴를 클릭하면 아래 화면처럼 시험 응시 버튼이 있습니다.

시험은 오픈북 형식으로 90분 동안 70문제가 출제되고 모두 객관식입니다. 80%이상 맞추면 합격입니다.

응시료는 "무료"입니다. ^^  그리고 불합격하면 일주일 후 다시 응시 할 수 있습니다.


시험 준비는 구글 애널리틱스 인증 시험 준비 포스트를 참고 하세요.


Posted by 값진인생
,