[프로젝트 진행 상황]
- 최종 고객 클러스터링 완료
- 고객 별 인사이트 확인 및 PPT 제작 단계 시작
1. 데이터 전처리 후 최종 클러스터링을 위한 컬럼
- 'current_age'
- 'per_capita'
- 'DTI',
- 'high_amount_ratio',
- 'trans_stats'
2. pca
- 차원은 2
- 설명 분산 계수 : 0.60362
3. 초기 K값 찾기
3. 군집 계산
Cluster count percentage
0 0 79 7.41
1 1 195 18.29
2 2 236 22.14
3 3 211 19.79
4 4 345 32.36
=== 군집 결과 비교 ===
[K-Means] Silhouette = 0.333484 , Davies-Bouldin = 0.959885
[DBSCAN] Silhouette = 0.404105 , Davies-Bouldin = 0.479147
[Agglomerative] Silhouette = 0.264445 , Davies-Bouldin = 1.076799
0 0 79 7.41
1 1 195 18.29
2 2 236 22.14
3 3 211 19.79
4 4 345 32.36
=== 군집 결과 비교 ===
[K-Means] Silhouette = 0.333484 , Davies-Bouldin = 0.959885
[DBSCAN] Silhouette = 0.404105 , Davies-Bouldin = 0.479147
[Agglomerative] Silhouette = 0.264445 , Davies-Bouldin = 1.076799
# 최종적으로 클러스터별 특성을 정리한 뒤 클러스터와 다른 특성을 결합한 인사이트를 제시할 계획