til 55

데이터 분석 트랙 88일차 25.06.11. [TIL]

[최종 프로젝트 진행 8일차] 튜터님 미팅 내용 정리 - 현 데이터 셋에서 "transaction" 데이터 테이블에서 '할인 컬럼'은 2개가 있다. - 그들 중 "campaign_table"과 연관된 것을 확인해보고 있었음.# 구매 상품 중에 캠페인이 얼마나 적용되었는지 볼 때 어떻게 볼 것인가? # 데이터를 전체적으로 병합할 때 다음의 할인 가설과 결과가 나온다.1. 쿠폰 match에서 할인==0 쿠폰 할인 !=0 => 캠페인 번호가 있는 경우가 많음!2. 쿠폰 match !=0 쿠폰 할인 ==0 => 캠페인 번호가 없는 경우가 있음.3. 쿠폰 match !=0 쿠폰 할인 !=0 => 캠페인 적용이 되어 있음! 문제 결론 : "쿠폰 할인 !=0" 중에서 캠페인 번호가 있는 경우 발견!우리의 가설 :쿠폰..

내일배움캠프 2025.06.11

데이터 분석 트랙 87일차 25.06.10. [TIL]

[최종 프로젝트 진행 7일차]"streamlit"과 "취업 특강" - 수강 내용은 금주 WIL에 별도로 정리 후 저장- 특히 "취업 특강" 부분은 한글 파일에 적어둔 내용을 정리하며 복기하는 방향으로 작성! - streamlit의 경우 실습 파일의 코드를 살펴보며 복습하는 느낌으로 2회 강의 내용 - 또한 api부분과 관련된 내용을 정리할 필요 있음.프로젝트 진행 상황(개인 진행 상황) - 쿠폰 사용율이 높은 캠페인 번호 별 특징 확인목표 1. 캠페인 번호 중에서 효과적이라고 생각하는 캠페인 참여율 확인사용하는 데이터 프레임 : 쿠폰테이블에서 캠페인별 쿠폰 코드를 확인 ⇒ 쿠폰 사용 테이블에서 사용 쿠폰수 확인. ⇒ 캠페인 table 에서 수신한 가구수 계산 ⇒ 1차 병합(쿠폰, 쿠폰사용, 캠페인) ⇒ ..

내일배움캠프 2025.06.10

데이터 분석 트랙 86일차 25.06.09. [TIL]

[최종 프로젝트 진행 6일차]분석 방향1. 고객 페르소나 확인 : "인적 정보가 등록된 고객"의 주된 연령대, 가족 단위, 주요 구매 상품, 수신한 마케팅 캠페인의 분포를 확인 (인구 통계 별 분포 및 통계적 의미 확인)2. 캠페인 성과 분석 시작 2.1. campaign_table의 DESCRIPTION에는 캠페인의 3가지 타입이 있다. 각각이 무슨 특성을 갖는지 확인 - '누구'를 타겟으로 한 마케팅 타입인가? - '어떠한' 마케팅 엑션인가?(df의 DESCRIOTION과 CAMPAIGN, SALES_VALUE, RETAIL_DISC, 'COUPON_DISC', 'COUPON_MATCH_DISC') # 캠페인 반응 = 매출, 할인율 - 캠페인 별로 어떤 제품군을 홍보했는가? 2.2. 실..

카테고리 없음 2025.06.09

데이터 분석 트랙 85일차 25.06.05. [TIL]

[최종 프로젝트 진행 5일차]개인 담당 분석과 "campaign_table" EDA튜터님 질의응답개인 담당 분석과 "campaign_table" EDA1. 캠페인 분석 1.1. 분석 목표 - 1차적으로 캠패인 분석을 시작! "campaign_table"을 EDA 시행, 컬럼의 의미 및 분석 결과를 확인 - 그 다음, "coupon_redempt" 테이블에 대한 분석을 시작! 가구 및 쿠폰, 캠페인과 같이 다양한 분석 방향이 적용 가능 - 우선, "캠페인별 성과를 확인"하는 것을 1차 목적으로 분석! 그 후 왜 그러한 성과가 나타났는지 원인 분석으로 넘어간다. 1.2. 현재 분석 결과 (요약 : 캠패인 테이블 확인 완료, 쿠폰 사용 테이블과 연결하여 분석 시작해야한다!)CAMPAIGN_TABLE E..

카테고리 없음 2025.06.05

데이터 분석 트랙 84일차 25.06.04. [TIL]

[최종 프로젝트 진행 4일차]데이터 테이블 및 컬럼 정리테이블 결합 코드1차 분석 인사이트데이터 테이블 및 컬럼 정리1. “hh_demographic” : 고객 데이터 1.1. 설명 - 고객 중 일구 가구(801 개)의 정보 [전체 고객 중 약 30%를 차지] - 데이터 특성 상 신상 정보는 마스킹 되어 있다. 1.2. 컬럼 설명 A. HOUSEHOLD_KEY : 각 가구에 대한 고유키 (PK) # FK) "TRANSACTION_DATA", "CAMPAIGN_TABLE" B. AGE_DESC : 추정 연령대 C. MARITAL_STATUS_CODE : 결혼 여부 (A=기혼, B=미혼, C=모름) D. INCOME_DESC : 각 가구의 수입 E. HOMEOWNER_DESC : 각 가구 구성 (Homeo..

내일배움캠프 2025.06.04

데이터 분석 트랙 82일차 25.06.02. [TIL]

[금일 학습 내용] - 파이썬 종합반 6회차 머신러닝1 수강 [최종 프로젝트 진행 상황] - GA4 데이터 셋의 데이터 양이 너무 방대하여 활용하기 어렵기에 데이터 셋을 변경https://www.kaggle.com/datasets/frtgnn/dunnhumby-the-complete-journey?select=campaign_desc.csv Dunnhumby - The Complete JourneyRetail focused consumer datawww.kaggle.com던험비 - 고객 여정 분석 데이터셋.# 링크 : https://github.com/Lanbig/CSC465-visualization-project/blob/master/Dataset/dunnhumby%20-%20The%20Complete..

내일배움캠프 2025.06.02

데이터 분석 트랙 79일차 25.05.30. [TIL]

[최종 프로젝트] 1. 분석 데이터 셋 : " Google Merchandise Store"의 "Google Analytics" 데이터 셋으로 선정 # 트래픽 소스 데이터, 콘텐츠 데이터, 거래 데이터가 포함되어 있다. 2. 분석 목표 : 고객 행동 분석 및 퍼널 분석을 통한 마케팅 전략 도출 시도 3. 현재 빅쿼리에서 데이터를 다운 받아 저장하고 있다. [해야할 일] - [파이썬 종합반 5강 - 데이터 분석 및 검정] - "최종 프로젝트 데이터셋 저장" 이후 인사이트 정리 및 강의 내용 정리 예정 - 스파크 강의 수강 - 파이썬 종합반 6강 강의 자료 공부 - 최종 프로젝트 데이터 셋 다운완료 및 EDA와 전처리 준비

내일배움캠프 2025.05.30

데이터 분석 트랙 77일차 25.05.28. [TIL]

[최종 프로젝트 데이터 탐색] - 프로젝트의 목표 : 고객 데이터 분석을 통한 마케팅 전략 제시 - 사용하고자 하는 분석 혹은 기법 : 퍼널 분석(AARRR), 머신러닝-클러스터링, 전환율 및 이탈율 확인, 코호트 분석. # 즉, 고객의 유입 및 이탈을 퍼널 별로 행하고 싶다. 참고 사례1) A사의 CRM 마케팅 데이터 분석 서비스[주요 제공 서비스] - 온사이트&메시지 캠페인 자동화 - 커스텀 캠페인 및 오디언스 생성(쉬운 UI/UX) - 캠페인 성과 분석(캠페인 별 노출수, 발송수, 클릭률, 구매 전환율, 등등) - 사이트 데이터 분석(매출, 구매전환율, 구매 객단가 ,퍼널, 우입지표 전체) - 고객 데이터 분석(고객별 세션수, 구매주기 이탈률, CLV, 구매 가능성 등) - 상품 데이터 분석(노..

내일배움캠프 2025.05.28

데이터 분석 트랙 72일차 25.05.23. [TIL]

[QCC 6회차]- 이번 시험은 어려웠음.- 쿼리를 작성하기 위해 고려해야 할 사안이 많았다.ex. 윈도우 펑션의 2가지 order by, 3개 테이블 결합시 조인키와 colesce, timestampdiff()식- 가장 빠른 만점 제출자가 50분 걸린 정도...- 그래도 가장 실용적인 구문이니 차후 다시 확인해보자. Q1. 성별 별로 성적 상위 3명의 정보 가져오기(만일 공동등수일 경우 나이가 많은 사람이 우선)select *, rank() over (partiton gender order by score desc, age desc) rnfrom studentswhere (rank() over (partiton gender order by score desc, age desc)) # 다른 방법-- R..

내일배움캠프 2025.05.23

데이터 분석 트랙 71일차 25.05.22. [TIL]

[실전 프로젝트 마무리](라이브) - 대시보드 이미지적으로 사실 완성도 높게 만들었음. - 설명한 장표만 보아도 1대시보드에 얼마나 많은 내용이 담겼는지 확인 가능 - 대시보드 사용자가 여러명이기에 각각의 내용에 따른 내용을 확인할 수 있기에 좋았다. 수정요소 : 구현된 대시보드와 최종적인 인사이트 및 전략 사이의 매칭이 잘 되지 않았다.즉, 처음 사용하는 사용자가 대시보드의 기능이 무엇이 있는 지는 알수 있지만 어떻게 사용해야그러한 마케팅 전략이 나올 수 있는지 쉽게 이해되지 않는다.따라서 전략 부분의 PPT 혹은 자료에선 그를 보완할 시각화자료(이 전략이 대시보드의 어느 기능에서 나왔는지)를 넣어 그를 보완하면 좋을 것 같다. [Keep]- 튜터님과 거의 매일 피드백을 주고받을 수 있어서, 현재 부족..

카테고리 없음 2025.05.22