카테고리 없음

데이터 분석 트랙 47일차 25.04.18. [TIL]

jjaio8986 2025. 4. 18. 11:18

데이터 분석 [심화 프로젝트]

 

  • 선택한 주제 : 금융 데이터 - "고객 클러스터링"
  • 설명 : 금융 고객데이터에 대한 클러스터링 시행 및 군집별 인사이트 도출

 

  • 심화 프로젝트 개요
  • 신용 위험도 기반 고객 세분화 및 인사이트 도출
  • 목적
  • 고객의 신용점수, 총 부채,소득 등의 데이터를 바탕으로 잠재적인 신용 위험도를 분석
  • 클러스터링을 통해 고객을 위험도 등급(high/medium/low) 으로 그룹화
  • 활용 방안:
  • 금융 상품 설계시 도움을 줌
  • 대출 심사 기준 보안?
  • 기업 입장에서의 리스크 최소
  • 신용도 위험 관련 관리대책
  • 파생변수 찾아보기
  • DTI = Total Debt / Yearly Income (Debt-to-Income ratio)
  • 카드당 평균 한도 : credit_limit /num_cards_issued
  • 활용 변수 : 'total_debt', 'yearly_income', 'per_capita_income', 'num_credit_cards', 'card_on_dark_web', 'credit_limit' 'num_cards_issued',
2. 프로젝트 분석 흐름 
 본 프로젝트는 고객의 신용점수, 총 부채, 소득, 카드 발급 수 등 주요 재무 지표를 활용하여 데이터를 전처리한 후, 클러스터링 기법을 적용해 고객군을 세분화하였습니다. 이후 각 군집별 특성을 분석하여 주요 위험요인과 행동 패턴을 도출하고, 이를 기반으로 금융사의 맞춤형 리스크 관리 전략과 금융상품 설계 방향을 제시할 예정입니다.
3. 튜터님 피드백 
 - 핵심 : 기준(신용위험도)을 세워서 그룹화를 하고, 결과가 나오면 그 결과를 가지고 이용도, 소득수준, 부채 현황을 해석해라.
             파생변수 검색해서 찾아볼 것
             전처리는 좀 적은 편/ 그렇게 많지는 않은 편