데이터 분석 트랙 61일차 25.05.12. [TIL]
[실전 프로젝트 자료 정리]
<컬럼 개요>
# 데이터 1차 정보
- 총 51290개의 행, 24개의 컬럼
# 컬럼명 : 'Row ID', 'Order ID', 'Order Date', 'Ship Date', 'Ship Mode',
'Customer ID', 'Customer Name', 'Segment', 'Postal Code', 'City',
'State', 'Country', 'Region', 'Market', 'Product ID', 'Category',
'Sub-Category', 'Product Name', 'Sales', 'Quantity', 'Discount',
'Profit', 'Shipping Cost', 'Order Priority'
※ 컬럼 별 조사 정보는 VScode를 통해 확인하였으나 태블로와 다를 수 있음!
∴ 컬럼 이름 참고용 및 데이터가 어떤 의미인지만 확인하는 용도로 봐주시면 됩니다.
<컬럼 정리>
대분류 | 컬럼 명 | 한글 명 | 설명 |
고유값 | Row ID | 행 번호 | 각 컬럼에 해당하는 단순 번호들. |
Order ID | 주문 번호 | ||
Customer ID | 고객 번호 | ||
Product ID | 상품 번호 | ||
날짜 관련 컬럼 | Order Date | 고객 주문 날짜 | - 각 완료된 날짜 컬럼 - 둘 사이의 날짜 차이를 이용 차후 “배송 기간”이라는 계산된 필드 제작 가능 - “배송 기간”을 통해 차후 “기간 별 추가 배송 금액” 산정가능 - “배송 기간”과 "VIP“를 필터링 시 추가 혜택 가능 - “배송 기간”과 “Segment”(주문 고객 유형 ex. 개인, 5인 이상 오피스, 제조 기업)를 활용 “맞춤형 배송 할인 전략” 제시 가능 |
Ship Date | 상품 배송 완료 날짜 | ||
배송 관련 컬럼 | Ship Mode | 배송 옵션 | - 총 4개 “Standard Class”(일반 배송) 30,775 “Second Class”(2등급 배송) 10,309 “First Class”(1등급 배송) 7,505 “Same Day”(당일 배송) 2,701 |
Shipping Cost | 배송 비용 | # 배송 비용 # 기준 확인을 위해 추가 분석 필요 |
|
Order Priority | 주문 우선도 | "low" 2,424 "Medium" 29,433 "High" 15,501 "Critical" 3,932 - ‘주문 우선도’와 'VIP_ID'와 같은 상관관계 확인 필요! |
|
고객 정보 | Customer Name | 고객 이름 | - 중복값 있음 - 총 796개의 고객 이름 - “VIP” 혹은 “충성 고객” 확인 가능 |
Segment | 고객 유형 | # 구매하는 고객의 유형 - Consumer(개인 소비자) 26,518 - Corporate(중소~대기업) 15,429 - Home Office (5~6명 단위 오피스) 9,343 # 느낌상 기업의 부서의 소모품 결제 |
|
Postal Code | 우편 번호 | - 결측값 존재 - 불필요한 컬럼 |
|
지역 관련 컬럼 | Market | 상위 지역 | - 5대양 67대주 느낌 - 고유값은 5개 “Asia Pacific” (태평양 서부 연안 지역) 14,302 “Europe" 11,729 "USCA"(중앙아메리카 연방공화국) 10,378 "LATAM"(라틴 아메리카) 10,294 "Africa" 4,587 |
Region | 지역 | - 23개 ex. Western Europe, Oceania |
|
Country | 국가 | - 165개 ex. United States, Bhutan |
|
State | 수도 # 대표적 도시단위 묶음 |
- 1,102개 ex. California, New York, Texas # 만일 지역 세그먼트 할 시 State는 사용하기 어려울 수 있음. |
|
City | 도시 | - 3,650개 ex. New York City, Los Angeles, Philadelphia |
|
상품 관련 컬럼 | Category | 상품 대분류 |
“Office Supplies”(사무용품) “Technology”(전자기기) “Furniture”(가구) - 결측값 없음. |
Sub-Category | 상품 소분류 |
- 총 17개 - 결측값 없음. |
|
Product Name | 상품명 | ||
Sales | 총 판매액 | ||
Quantity | 주문 상품 개수 |
||
Discount | 할인율 | ||
Profit | 수익 | - 주문된 상품의 판매액과 할인율, 배송 비용 등등을 고려 - 해당 주문에 대한 최종 수익 - (-)값 존재! - 값의 분포가 너무 크기에 파악시 주의 |
|
cf) df['Profit'].describe().round(2)의 값 count 51290.00 mean 28.61 std 174.34 min -6599.98 25% 0.00 50% 9.24 75% 36.81 max 8399.98 # 해석(다른 CSV연동 하지 않았기에 태블로 확인시 별도 확인 필요) - 전체 평균값이 28.61이고 극단값이 존재! 대부분의 수익이 36.81달러이다. - 극단값의 존재는 이상치의 존재! 즉, VIP 고객 혹은 진상 고객, 환불, 할인율과 연관되어 있다. 따라서 "VIP"그룹 확인 뒤 그들의 매출 비중 확인, 매출 악영향 요인 확인(할인 많이 하거나, 배송비 혹은 주문 우선순위 상 "Critical“에 해당하는 고객의 주문 정보(Sales)등등의 요건을 확인하여 별도 조치가 필요한 대상으로 확인해 볼 수 있다. |
<태블로 대시보드 구성 사례> [마케팅]
대시보드 사례1 : 고객 정보 포함 시각화 및 수익 관련 시각화
Sales Dashboard #VOTD
A sales dashboard inspired by several dashboards found on Dribbble. #OneDashboardAMonth #KPI #Dashboard #Business #Analytics
public.tableau.com
대시보드 사례2 : 지역 정보 중심 판매 1위와 주문, 매출 시각화
https://public.tableau.com/app/profile/rosa.mariana.de.leon.e/viz/GoalAchievementDashboard-
ResponsiveRoundBackground/DashboardALL
Goal Achievement Dashboard - (Responsive Round Background) #VOTD
Goal Achievement Dashboard - (Responsive Round Background) Blog Tutorial : https://medium.com/ro.dleon.escriba/how-to-build-a-responsive-rounded-edges-background-in-tableau-8b91092ac663
public.tableau.com
대시보드 사례3(강추) : 글로벌 판매 성과지표 대시보드(매출 및 성장률, 주문량 및 성장률, 주문량(VOLUME) 및 성장률, 수익 및 성장률)
Superstore - KPI Color Coding #VOTD
Superstore - KPI Color Coding
public.tableau.com
대시보드 사례4(추천) : 맵 차트를 잘 꾸민 아주 좋은 시각화 자료(단 고객 정보가 포함된 사례) # 지역과 전체를 살펴보기에 좋은 메인 시각화 구성이면서 직관적임.
https://public.tableau.com/app/profile/tam.s.varga/viz/Superstore-Bento-Box/PerformanceOverview
Superstore - Bento Box KPIs
Superstore Performance Overview with Bento Box KPIs
public.tableau.com
KPI 시각화에 좋은 사례1 : 다양한 KPI지표를 Big Number로 구성하여 시각화 하는 워크시트 예시들
Superstore KPIs Inspiration
Superstore KPIs Inspiration
public.tableau.com