카테고리 없음

데이터 분석 트랙 52일차 25.04.25. [TIL]

jjaio8986 2025. 4. 25. 20:59

[프로젝트 진행 상황]

 - 최종 고객 클러스터링 완료

 - 고객 별 인사이트 확인 및 PPT 제작 단계 시작

 

1. 데이터 전처리 후 최종 클러스터링을 위한 컬럼 

 - 'current_age'

 - 'per_capita'

 - 'DTI',

 - 'high_amount_ratio',

 - 'trans_stats'

 

2. pca

 - 차원은 2

 - 설명 분산 계수 : 0.60362

 

3. 초기 K값 찾기

 

초기 K 값

 

3. 군집 계산

       Cluster count percentage
0      0          79      7.41
1      1          195    18.29
2      2          236    22.14
3      3          211    19.79
4      4          345    32.36

=== 군집 결과 비교 ===
[K-Means] Silhouette = 0.333484 ,          Davies-Bouldin = 0.959885
[DBSCAN] Silhouette = 0.404105 ,         Davies-Bouldin = 0.479147
[Agglomerative] Silhouette = 0.264445 , Davies-Bouldin = 1.076799

최종 클러스터 별 레이더 차트
클러스터 별 변수의 비중

 

 

# 최종적으로 클러스터별 특성을 정리한 뒤 클러스터와 다른 특성을 결합한 인사이트를 제시할 계획