데이터 분석 [심화 프로젝트]
- 선택한 주제 : 금융 데이터 - "고객 클러스터링"
- 설명 : 금융 고객데이터에 대한 클러스터링 시행 및 군집별 인사이트 도출
- 심화 프로젝트 개요
- 신용 위험도 기반 고객 세분화 및 인사이트 도출
- 목적
- 고객의 신용점수, 총 부채,소득 등의 데이터를 바탕으로 잠재적인 신용 위험도를 분석
- 클러스터링을 통해 고객을 위험도 등급(high/medium/low) 으로 그룹화
- 활용 방안:
- 금융 상품 설계시 도움을 줌
- 대출 심사 기준 보안?
- 기업 입장에서의 리스크 최소
- 신용도 위험 관련 관리대책
- 파생변수 찾아보기
- DTI = Total Debt / Yearly Income (Debt-to-Income ratio)
- 카드당 평균 한도 : credit_limit /num_cards_issued
- 활용 변수 : 'total_debt', 'yearly_income', 'per_capita_income', 'num_credit_cards', 'card_on_dark_web', 'credit_limit' 'num_cards_issued',
2. 프로젝트 분석 흐름
본 프로젝트는 고객의 신용점수, 총 부채, 소득, 카드 발급 수 등 주요 재무 지표를 활용하여 데이터를 전처리한 후, 클러스터링 기법을 적용해 고객군을 세분화하였습니다. 이후 각 군집별 특성을 분석하여 주요 위험요인과 행동 패턴을 도출하고, 이를 기반으로 금융사의 맞춤형 리스크 관리 전략과 금융상품 설계 방향을 제시할 예정입니다.
본 프로젝트는 고객의 신용점수, 총 부채, 소득, 카드 발급 수 등 주요 재무 지표를 활용하여 데이터를 전처리한 후, 클러스터링 기법을 적용해 고객군을 세분화하였습니다. 이후 각 군집별 특성을 분석하여 주요 위험요인과 행동 패턴을 도출하고, 이를 기반으로 금융사의 맞춤형 리스크 관리 전략과 금융상품 설계 방향을 제시할 예정입니다.
3. 튜터님 피드백
- 핵심 : 기준(신용위험도)을 세워서 그룹화를 하고, 결과가 나오면 그 결과를 가지고 이용도, 소득수준, 부채 현황을 해석해라.
파생변수 검색해서 찾아볼 것
전처리는 좀 적은 편/ 그렇게 많지는 않은 편
- 핵심 : 기준(신용위험도)을 세워서 그룹화를 하고, 결과가 나오면 그 결과를 가지고 이용도, 소득수준, 부채 현황을 해석해라.
파생변수 검색해서 찾아볼 것
전처리는 좀 적은 편/ 그렇게 많지는 않은 편