카테고리 없음

데이터 분석 트랙 59일차 25.05.08. [TIL]

jjaio8986 2025. 5. 8. 23:10

<태블로 사용법>

- 태블로는 버전이 많다!(데스크탑에서 쓰는 local한 것이 있고 테블로 public에 공유되는 것, 지급받은 서버버전이 있음)

 

# 태블로 서버 vs 데스크탑

- 서버는 클라우드와 같은것! 클라우드에서 시각화 자료를 만드는 것! 마치 구글 드라이브에서 시각화 자료를 만들면 구글 드라이브를 공유하는 사람들 끼리 볼 수 있음.

- 데스크톱은 내 컴퓨터 안에만 있음! 기능은 서버보다 많음! 공유적인 측면에서 상대적으로 서버보다 제한적인 부분이 있음!

- 만일 시각화 자료를 잘 만들고 싶으면 데스크 톱 버전에서 진행한 뒤에 공유하는 것으로!

 

0. 데이터 불러오기!

 

 

- ARPU(Average Revenue Per User) = 총 매출 / 전체 구매자 수

 

1. 태블로 실습

1단계 : 데이터 가져오기 및 준비

- 데이터 Load : 주어진 event.csv파일을 태블로에 불러옴

- 데이터 정리 : event_time을 날짜 타입으로 변환

- 계산된 필드 만들기  # 대소문자 꼭 구분해서 적기!

a. Revenue : SUM(if [Event Type]='purchase' then [Price] else 0 end)

b. Unique Users : COUNTD([user_id])   

 # "countD" == "distinct"+"count"

c. ARPU : [Revenue]/[Unique Users]   

 # 유저당 평균 매출, 일명 ARPU(Average Revenue Per User)는 일정 기간 동안 고객 한 명당 발생된 평균 수익

 

cf) 태블로의 테이블 부분은 그룹핑용이고 아래의 초록색 변수들은 별도의 카테고리처럼 계산하기 위한 값들!

cf) 태블로에도 if, else if 문이 있다!(즉, SQL, 파이썬과 같이 다양한 변수를 제작 및 계산식을 만들 수 있다!)

 

2단계 : 주요 지표를 위한 숫자 카드(Big Number) # 차원이나 측정값을 마크 부분의 텍스트, 레이블 부분에...

 

- 시각화 유형 : Big Number # , 워크시트에 단위별 확인하고 싶은 대상을 필터에 차원을 넣건 측정값을 넣고 등등의 작업을 거쳐서 만드는 것!

a. Revenue # 숫자 서식에 들어가 통화(사용자 지정)혹은 통화(표준)으로 들어가서 원하는 형태로 $를 붙이건 뭘 하건 수정 가능!

b. Unique Users

c. Revenue per User (APRU)

 

- 사용 목적

핵심 성과 지표를 간단명료하게 보여주고자 할 때

전체 성과를 빠르게 스냅샷처럼 확인할 때

 

3단계 ARPU 추이 시각화 (Line Graph)

# 만일 행에 있는 값에 레이블 별로 숫자를 넣고 싶다면 컨트롤 키를 누른 상태에서 차원 혹은 측정값을 [마크]탭에 있는 기능에 넣기!

 

시각화 유형 : Line Graph

X: event_time(일단위)

Y: 일별 Revenue per User(ARPU)

 

사용 목적

시간에 따른 변화, 추세를 명확하게 보여줄 때 매우 효과적

계절성, 캠페인 영향, 이상 징후 등을 시각적으로 빠르게 감지 가능!

 

4단계 : Revenue vs Users 흐름(이중 조합 Bar + Line 그래프)

- 시각화 유형 : Dual Axis (Bar + Line)

Bar : 일별 총 Revenue

Line : 일별 Unique User

 

사용 목적

서로 다른 단위(매출 vs 사용자 수)를 한 화면에서 비교 가능

매출이 증가에 따른 사용자의 증가 혹은 객단가(ARPU)의 증가인지 구분 가능

 

5단계 : Revenue per User 분포(Boxplot)

- 시각화 유형 : Boxplot

ARPU 분포를 박스플롯으로 표현!

# 측정값을 행(확인할 값)에 넣은 뒤 차원을 [마크] > 세부정보 부분(구분할 단위!)에 넣어야 박스플롯이 만들어진다.

# 추가적인 박스플롯을 만들 때(다른 기준으로 확인 시) 열 부분에 차원을 넣기!

사용 목적

데이터의 중앙값, 퍼짐 정도(분산), 이상치(Outlier)까지 한 눈에 파악 가능

평균만 보는 착시를 방지! 사용자군의 특성 등을 심층적으로 분석할 수 있다.

 

<태블로 시각화 방법>

1. 바플롯 제작

 1.1. 차원을 행에 넣는다

 1.2. 테이블에 생긴 측정값 이름을 필터에 넣고, 열에 넣는다.

 1.3. 초록색 측정값을 열에 넣는다.

 

2. 스캐터 플롯 제작

 2.1. 수익과 매출을 각각의 열과 행에 옮긴 뒤 각각을 차원 혹은 별도의 측정값 으로 전환한다.

 2.2. 고객 별로 보기 때문에 고객 id를 마크의 세부 정보에 옮긴다.

 2.3. 색상의 차이를 넣기 위해 수익률을 마크의 색상에 넣는다.

 2.4. 색이 너무 극단적으로 나오기에 색상 편집 > 고급에 들어가 시작 값과 끝값을 지정(-0.5~+0.5)

 2.5. 주석의 범위가 알아보기 힘들기에 마크에 있는 집계의 숫자서식에 들어가 백분율로!

 

cf) 워크시트의 캡션표시를 누르면 캡션이 생김! 거기에 워크시트의 내용을 설명할 수 있다!

cf) 대시보드에서도 추가 택스트 박스를 넣을 수 있다.

 

3. 랭킹 바 차트

한정된 수를 필터링하려면

그룹핑하여 값을 나눈 변수를 컨트롤 눌러 "필터"부분에 옮긴 뒤

"상위/하위" 탭에 들어가서 필드 기준으로 간 뒤 필드=수익!으로 개수 지정 가능!

 

4. 필터&대시보드!

 대시보드의 크기에서 대시보드 크기를 조정 가능!

 

5. 추가 기능

 5.1. 필터 추가!

  - 워크시트 중 하나를 아무거나 선택

  - 거기에 제작하고자 하는 필터를 제작

  - 워크시트를 불러오면 그 필터가 나온다!

  중요! 대시보드 안에서 필터를 만들 수 없음! 워크시트에서 필터를 만든 뒤 그것을 불러와야 한다!

 <필터 전체 적용 시> : 필터에 기타옵션을 누르면 워크시트에 적용을 누르면 다양한 항목이 나옴!

항목을 선택하면 그에 맞춰 적용된다! 선택적으로 혹은 전체적으로 적용 가능!

 

 5.2. 대시보드의 각 시트를 연동하는 법

  - [대시보드]의 동작을 누름

  - 동작 추가를 누름!

  - "필터"를 누르고 연동할 원본 워크시트와 연결한 워크시트 체크

cf) 필터 대신 다른 동작도 가능! , 해당 워크시트의 값에 클릭하거나 마우스 오버하거나 등등의 동작마다 어떤 동작을 할 것인가!

# 가급적 자주 조작하게 되는 원본 시트는 선택 항목에서 체크를 푸는 것이 좋음. (모양이 모씽겨짐)

 

cf) 추가로 URL이나 시트를 선택하면온라인에 올려놓은 다른 대시보드, 시트, 다른 웹사이트 등등으로 이동할 수 있다! (이게 롤 대시보드였구나...)

cf) URL을 워크시트의 값마다 넣을 순 없음! URL 동작 기능은 어떤 값을 누르건 같은 URL로 이동하게 된다...

 

# 강사 추천 태블로 영감 얻는 사이트!

https://public.tableau.com/app/discover/viz-of-the-day

필터를 버튼 식으로 제작 가능.(워크시트1을 대시보드>동작으로 만들어서)

오픈소스로 다운받을 수 있음... 마치 canva같이...