[목차]
1. SQL 라이브강의 5회차 인사이트 정리
2. 파이썬 기초 강의 정리(1~5)
1. SQL 라이브강의 5회차 인사이트 정리
- UNION은 그다지 많지 않은 컬럼을 수평 결합하여 조회할 때 사용된다!
- JOIN으로 묶는 공통 컬럼은 컬럼명이 동일할 필요는 없다!
[공통컬럼이라는 의미는 테이블1의 컬럼의 내용물과 테이블 2의 컬럼의 내용물이 동일하다는 의미]
- "INNER JOIN" : 공통 컬럼을 기준으로 두 테이블에서 일치하는 값을 가져온다. [공통컬럼 중 하나는 한 테이블의 PK이기에 NULL값이 없다. 즉, PK컬럼을 기준으로 결합되는 데이터들 중에서 그 값이 없는 것을 제외하고 묶어준다는 의미이다. 교집합!]
- LEFT JOIN : "LEFT JOIN" 함수 기준 왼쪽 편에 위치한 테이블이 기준 테이블이다. 기준 테이블의 모든 행과 오른쪽 테이블의 일치하는 행을 출력하고 일치하는 항목이 없을 때 NULL값이 출력된다. [기준 테이블을 어디로 설정하느나에 따라 결과값이 다르게 나타난다. 기준테이블 기준 오른쪽 테이블의 불일치 항목을 NULL처리 하기에]
- JOIN시 유의사항 : SUB쿼리를 JOIN으로 연결할 때 WHERE를 적용할 시 컬럼별로 서브쿼리를 열어 가져올 컬럼을 선정하여 묶는것이 오류 가능성을 낮출 수 있다.
- 서브쿼리와 함께 조인한 쿼리문에서 에러 발견시 에러 확인 순서는 '서브쿼리내부', '조인문', '본쿼리문' 순서이다.
cf) 현업에서 서로 다른 사람이 상대의 코드를 확인하는 것을 "크로스체크"라고 한다면, 자신의 데이터를 확인해보는 것을 "정합성 체크"라고 한다.
2. 파이썬 기초 강의 정리 (1~5)
2.1. 변수 선언과 자료형
- 변수 : 어떠한 값을 담는 것을 말한다. 컴퓨터 입장에선 값이 담긴 위치를 지목하는 것을 의미한다.
- 변수선언 : 파이썬에서 새 변수를 만들 때 "변수이름 = 값"의 형태로 선언을 한다. 여기서 'a=b' ,'b=a'는 서로 다른 의미이다.
- 출력, 반환 : 파이썬에서 어떠한 대상을 출력시 "print(대상)"의 형태를 사용한다.
- print(대상) : 대상에 해당하는 부분에는 사칙연산(+,-,*,%,//), 문자('', ""), True-False, 등 다양한 대상이 들어갈 수 있다.
- 자료형 : 프로그래밍을 할 때 쓰이는 숫자, 문자열 등 자료 형태로 사용하는 모든 것을 의미!
a) 숫자 : 정수, 소수 등 다양한 형태의 숫자를 사용할 수 있다. 숫자끼리는 사칙연산이 가능하고 몫(//)과 나머지(%), 거듭제곱(**), 등을 구할 수 있다. 특히! 계산된 값을 변수에 저장한 뒤 다시 그 값을 같은 변수에 저장할 수 있다.
(ex. a = 5 줄바꿈 a +=3 #8 )
b) bool 자료형 : True, False로 나타내는 불(Boolean)자료형이 있다.
- 변수들이 참, 거짓의 값을 담을 수는 있으나 True, False를 변수명으로 쓸 수 없다! 기억하자.
(ex. a =(3>2) # True)
[값을 소문자로 쓸 시 자료형으로 인식 못하고 변수명으로 인식하니 주의한다.]
cf) 다양한 연산, 함수, 변환 등등의 기능들을 모두 기억할 수 없다. 때문에 자주쓰는 기능들을 숙련한 뒤 나머지 기능들은 구글링 등을 통해 알아보는 것이 좋다.
c) 문자열 : 파이썬은 '글'도 데이터로 사용할 수 있다. "str()", 작은 따옴표, 큰 따옴표로 묶어서대상을 문자열로 반환할 수 있다.
+) "int()"를 통해 괄호안의 대상을 숫자형으로 전환할 수 있다.
- print(문자 + 문자)를 통해 출력하는 문자를 붙여서 출력할 수 있으나 (문자 + 숫자)의 조합은 불가능하다! 그렇기에 숫자를 작은따옴표로 변수를 문자형 데이터로 지정해 결합하여 출력할 수 있다. (ex. a = '2' b = 'hello' print(a+b) # 2hello)
- "len()"을 통해 문자열의 길이를 구할 수 있다. 이때 쉼표, 띄어쓰기, 특수기호, 한글, 등등도 하나의 문자로서 계산된다.
- 특정 자료형 뒤에 " . "을 붙이고 쓰는 함수를 메소드(method)라고 하는데 그 종류는 다음과 같다.
글자1.upper() == "글자를 대문자로 바꾼다." // 글자1.lower() == "글자를 모두 소문자로 바꾼다." // 글자.
- SPLIT(대상) : "글자 내의 대상을 기준으로 대상을 추출한다." 이때, "[]"안에 숫자를 넣어 대상의 요소를 순서에 맞게 지정하여 출력할 수 있다. (순서는 반드시 0부터 시작한다)
2.2. 인덱싱, 슬라이싱, 리스트, 딕셔너리
a. 인덱싱 "글자가 들어가 있는 변수[순서]" : 문자열의 글자 중에서 지정한 숫자에 맞춰 출력한다.
b. 슬라이싱 "글자가 들어가 있는 변수[ : ]" : 문자열의 일부를 잘라내서 출력한다.
변수[숫자1:] "숫자1을 초과하는 순서부터 출력한다! 즉, 글자의 순서 중 앞의 숫자1만큼을 제외!, 초과한 순서에 해당하는 글자 출력!"
변수[:숫자1] "숫자1 이하의 순서에 해당하는 대상을 출력한다."
변수[숫자1:숫자2] "숫자1 초과 숫자2 이하에 해당하는 글자들을 출력한다."
변수[:] "모든 글자를 출력한다.", 변수[-1] "마지막 글자를 출력한다."
c. 리스트(list) : 순서가 있는 서로 다른 자료형들의 모임! 다양하고 수없이 많은 자료형을 순서에 따라 넣어둔 것이다.
- 리스트의 길이 또한 "len()"함수를 통해 측정할 수 있고, 순서가 있기 때문에 인덱싱과 슬라이싱이 가능하다!
- ".append(원소)"를 통해 리스트 안에 원소를 집어넣을 수 있다. 이때 추가된 원소는 가장 마지막에 위치하며, 그 값은 무엇이든 될 수 있다.
- ".sort()"를 통해 오름차순으로 ".sort(reverse=true)"로 내림차순으로 정렬이 가능하다. 단! 숫자와 문자가 섞여있을 시 정렬이 불가능하다! 반드시 숫자끼리, 문자끼리 정렬해야 한다.
- print(값1 in 리스트1)를 통해 리스트 안에 값1이 있는지 확인할 수 있다. 이때 값은 참, 거짓으로 나온다.
d. 딕셔너리 : 키와 벨류로 이루어진 자료의 모임이다.
- 리스트가 "[]"를 통해 만들어 진다면, 딕셔너리는 "{}", "dict(키1:벨류1)"를 통해 만들 수 있다.(공집합도 만들 수 있다.)
- 순서가 없기에 인덱싱이 불가능하다.
- 벨류에는 아무 자료형이나 쓸 수 있고, print(키1 in 딕셔너리1)를 통해 키의 존재 유무를 확인할 수 있다.(값은 참, 거짓으로 출력)
- "딕셔너리명_dict['키1'] = 값1"을 통해 키와 벨류를 추가할 수 있다.
이터
분석 트랙 8일차(25.02.26.) TILㅇ
데이터 분석 트랙 8일차(25.02.26.) TIL
'내일배움캠프' 카테고리의 다른 글
데이터 분석 트랙 13일차 (25.03.06.) TIL (0) | 2025.03.06 |
---|---|
데이터 분석 트랙 2주차 (25.03.02.) W.I.L. (0) | 2025.03.02 |
데이터 분석 트랙 1주차 (25.02.23.) W.I.L. (0) | 2025.02.23 |
데이터 분석 트랙 1일차(25.02.17) TIL 직무 분석 - 'CRM 마케터' 정리 (0) | 2025.02.17 |
2025.02.07. 내일배움캠프(사전캠프) 5일차 (0) | 2025.02.07 |