내일배움캠프 27

데이터 분석 트랙 54일차 25.04.29. [TIL]

[심화 프로젝트 진척도] - 발표 대본 완성 및 발표 연습단계 - 발표 연습을 거치며 최종적으로 대본 길이를 조절한 뒤 시각화 부분에 투자할 예정 - 클러스터별 해석을 보조할 데이터 분석 내용 인지 필요(ex. cluster_0의 DTI에서 총 부채 : 7300만, 총 수익 : 7400만) # 핵심은 클러스터링과 클러스터 별 해석부분이니 이 부분을 위해 시간 안배를 잘 해야될 것 # to do : 클러스터 별 해석에 너무 많은 시간을 투자하여 공부를 하지 못했으니 반드시 SQL과 Python 코드 복습 및 머신러닝 기법들 한 번씩 다 회고! 특히 딥러닝 부분과 회귀, 분류, 이상탐지 부분은 최종 정리하기 데이터 분석 트랙 53일차 25.04.28. [TIL]

내일배움캠프 2025.04.29

데이터 분석 트랙 10주차 (25.04.27.) W.I.L.

1. 주간 회고 1.1. 프로젝트 진행 상황 - 머신러닝 > [금융] 군집분석을 시도하였다. - 현재 클러스터링을 통한 고객 그룹화는 완성하였고, 각 클러스터별 인사이트 확인 단계에 진입했다. - 인사이트 확인에 있어 크게 시간이 걸리지 않을 것 같아 바로 PPT 제작 및 외부 자료 조사에 진입하면 될 것이다. - 가령 고객 소비 생활 부분에선 [금융]부분이라는 점에서 활용하기 어려운 부분이 있지만(금융의 이미지) 고객 관리 앱에 한정하여 마케팅을 진행할 때 https://namu.wiki/w/%EB%93%80%EC%98%A4%EB%A7%81%EA%B3%A0/%EB%B0%88 듀오링고/밈듀오링고 의 밈 에 관한 문서. 듀오링고를 일정 기간 동안 사용하지 않으면 알림이 오는데, 일정 기간이 지나면 ..

내일배움캠프 2025.04.27

데이터 분석 트랙 49일차 25.04.22. [TIL]

[프로젝트 진행 상황] - 'client_id'를 기준으로 테이블(cards, transactions, users)별 데이터를 1차 그룹핑 후 결합하였다. # 약 1200명 가량의 고객 데이터 - 그 후 고객 세그먼트에 무의미할 컬럼들(ex. [dark_web 뭐시깽이] : 전부다 NO값)을 제거하고, 파생변수를 선정하여 다음과 같은 컬럼을 제작하였다.파생변수분류파생변수명조합에 사용된 원본 테이블의 컬럼[고객 재무](Financial Behavior) 총 부채 상환비율 (DTI)- 신용도 확인 목적- ['total_debt', 'yearly_income']신용카드 사용빈도 [비율]- 신용 한도 과도사용 여부 확인 목적- 신용 리스크 구분 목적- ['amount', 'credit_limit']평균 거래..

내일배움캠프 2025.04.22

데이터 분석 트랙 9주차 (25.04.20.) W.I.L.

주간 학습 회고심화 프로젝트 준비주간 학습 회고- 학습 내용 : 파이썬 선택형 학습반(개인 및 추가) 완강, 머신러닝추가 특강 완강, 머신러닝 기법 개인 실습- 통계적 기법 및 머신러닝 기법을 각각 혹은 둘 다 활용할 수 있는 수준까지 연습이 필요심화 프로젝트1. 선택 주제 : 금융 데이터 - 고객 클러스터링2. 목적 : 금융 도메인의 데이터(고객 정보, 카드, 지불 정보)를 가지고 새로운 고객 군집을 찾는다.3. 현재 선정한 프로젝트 개요 - 프로젝트 목표 : 신용 위험도 기반으로 고객을 세분화 및 군집 별 인사이트를 도출한다. - 프로젝트의 활용 : "금융 상품 설계", "대출 심사 기준 보완", "기업 입장의 리스크 최소화", "이탈 위험 고객 군집 확인 및 추가 액션이 필요한 군집 파악 가능" -..

내일배움캠프 2025.04.20

데이터 분석 트랙 43일차 25.04.14. [TIL]

파이썬 과제 정리 [함수, 클래스]파이썬 [함수] 실습 문제 : 가변 인자를 활용한 평균 계산기 - 설명 : 여러 개의 숫자를 입력받아 평균을 계산하는 함수 calculate_average를 작성 - 요구사항1. 숫자가 하나도 전달되지 않았을 경우 "입력된 숫자가 없습니다."라는 메시지를 반환2. 입력된 모든 숫자의 평균을 계산하여 소수점 2자리까지 반올림한 결과를 반환3. 함수 설명을 위한 적절한 docstring을 포함 - 구현 코드def calculate_average(*nums) : """ 전달받은 숫자의 평균을 반환하는 함수 *nums : 가변 위치 인자로 임의의 개수를 인자로 받고, 함수 내에서 튜플로 처리된다. len(nums)를 통해 빈 튜플인지 확인하여 입력 ..

내일배움캠프 2025.04.14

데이터 분석 트랙 8주차 (25.04.13.) W.I.L.

주간 학습 내용 회고금주 학습 목표 및 프로젝트 준비 방향 설정주간 학습 내용 회고1. 학습량 체크    # 기존에 목표로 했던 [통계, 머신러닝] 학습 중에서 통계는 마무리, 머신러닝은 절반 완료 1.1. 머신러닝 : 전체 10강 중에서 현재 6강 수강중   - 정리가 완료되는 대로 리뷰하며 추가 인사이트 확인 이때의 초점은 "개념 설명" 및 "실습 코드 해설", "결과 해석" 부분에 초점을 둔다.  1.2. 선택형 학습반 : 전체 8강 중 커리큘럼의 5강 수강 완료  - 함수 및 클래스 과제 수행 이후 판다스 라이브러리 개념 설명까지 리뷰 완료  - 차후 라이브러리 활용 내용은 기존에 진행한 파이썬 라이브러리 특강 세션의 내용과 함께 정리  1.3. QCC  - "self join" 부분과 "cros..

내일배움캠프 2025.04.13

데이터 분석 트랙 41일차 25.04.10. [TIL]

아티클 정리아티클 정리 "A/B테스트 제대로 이해하기 4 A/B테스트 표본 크기와 유의미한 결과 관계"https://yozm.wishket.com/magazine/detail/1667/ A/B 테스트 제대로 이해하기: 4 A/B 테스트 표본 크기와 유의미한 결과의 관계 | 요즘IT이전 글에서 기초 통계 지식을 바탕으로 A/B 테스트 계산기의 세팅 방법과 해석에 관한 내용을 살펴보았다. 이때 해석 내용 중 계산기에서 ‘결과가 유의미하지 않다(Not Significant)’라고 했을 때yozm.wishket.com1. 내용 요약 - 흔히 직관적으로 우리는 어떠한 의견(가설, 결과)의 근거가 “많은 사례와 의견들에서 지지받을 때” 유의미하고, 결과가 의견이 개연적(필연성이 높다)이라고 생각한다. 또한 A와 B..

내일배움캠프 2025.04.10

데이터 분석 트랙 40일차 25.04.09. [TIL]

통계학 총 정리1. 이론2. 유의성 검정3. 회귀 분석4. 상관관계5. 가설 검정 주의사항통계학 총 정리통계 이론과 데이터의 분포[통계 이론] > [개념] 1. 기술 통계, 추론 통계  1.1. 기술통계  # 데이터 요약, 설명을 목적으로 통계를 활용하는 방법,    A. 특징   - 주로 다음의 4~5개의 기본 통계값을 주로 활용한다.기본 통계값의 종류평균(mean)중앙값(median)분산(Variance)표준편차(Standard Deviation)범위(Range)특징- 데이터들의 주된 존재 위치 혹은 범위 추정 및 설명- 흔히 통계 분석 기법 중 "위치 추정"에 사용- 데이터들의 흩어진 정도[데이터들의 차이 정도]- 흔히 통계 분석 기법 중 "변이 추정"에 사용cf) [기술 통계의 기본 통계값들의 활..

내일배움캠프 2025.04.09

데이터 분석 트랙 7주차 (25.04.06.) W.I.L.

주간 학습 내용 회고금주 학습 목표 설정주간 학습 내용 회고1. 학습량 체크 및 목표 1.1. 기초 통계학 : 전체 6강 중에서 최종 4강 정리 및 학습 완료  - 인사이트 : 데이터 분석가는 파이썬의 라이브러리를 활용하여 다양한 기초 통계 및 통계기법을 통해 데이터 분석의 목표 설정 및 가설 설정과 검증 및 신뢰도 확보에 도움을 받을 수 있다. 다만 그 데이터의 종류(범주형, 수치형 등등)에 따른 검정 방법 이 다르기에 데이터의 확인('모집단' 과 '표본'으로 선정한 데이터의 주된 분포 및 형태, 가설 설정 시 확인할 지표)이 필요하다.  - 통계학을 마무리하며 학습한 통계적 기법들을 데이터 유형에 따라 도표 형태로 정리할 필요가 있다.  1.2. 선택형 학습반 : 전체 8강 중 커리큘럼에 따라 1.5..

내일배움캠프 2025.04.06

데이터 분석 트랙 36일차 (25.04.02.) TIL

basic 과제 코드 제작1. 표준 입출력 실습 문제 1.1. 자기소개 카드 만들기# 설명 : 사용자의 "이름", "나이", "취미"를 입력받아 정해진 형식의 자기소개 카드를 출력하는 프로그램 제작name = input("이름을 입력하세요:")age = input("나이를 입력하세요:")hobby = input("취미를 입력하세요:")print("┌─────────────────────────┐\n│      자기소개 카드        │")print(f"이름 : {name:>10}\n나이 : {age:\n취미 : {hobby}")print("└─────────────────────────┘")  1.2. 시간 변환기# 설명 : 사용자로부터 초를 입력받아 "시", "분", "초"로 변환하는 프로그램 제작..

내일배움캠프 2025.04.02