데이터 분석 트랙 5일차(25.02.21.) TIL
[목차]
1. SQL 강의 인사이트 정리
2. 팀별 1주차 발제 인사이트
1. SQL 강의 인사이트 정리
<2주차 강의 인사이트(엑셀보다 쉬운 SQL 강의 + 2회차 라이브세션)>
- MySQL을 사용한 구문에선 마지막에 세미콜론( ; )을 적기.
- DISTINCT 구문은 뒤에 이어지는 단위군의 중복을 제거하는 의미를 담고 있다.
가령) COUNT(DISTINCT 컬럼1)을 할경우 컬럼1의 중복되지 않은 데이터들의 개수를 구할 수 있다.
- WHERE 구문을 통해 연속해서 필터링하고자 할 때, 쉼표 ( , )가 아닌 조건문을 지원하는 연산자(AND, OR, NOT)를 사용해야 한다!
[NOT의 경우 "A IS NOT B"의 형태가 아닌 "A NOT IS B"와 같이 NOT이 뒤따라 오는 대상을 부정한다! 즉, 연산기호나 값에 선행하여 작성해야 한다!]
- 조건문을 지원하는 연산자 중에서 추가적으로 기억해야 할 것들
연산자 | 예시 | 의미 |
!= | X!= | X가 아닌 값 [NOT대신 !를 사용할 수 있다!] |
BETWEEN | X BETWEEN 값1 AND 값2 | X가 값1 이상 값2 이하에 해당하는 값 |
IS NULL | X IS NULL | X가 비어있는 값 |
IS NOT NULL | X IS NOT NULL | X가 비어있지 않는 값 |
NULL = 비어있는 값이라는 의미 |
- 조건문 중 IF와 CASE문이 있다. 이 중 퍼포먼스가 가장 용이한 CASE문을 사용하는 것을 권장한다. (IF는 MySQL에서만 사용되지만 CASE는 다양한 셋에서 사용 가능하기 때문.)
- CASE WHEN 작동 순서 : CASE WHEN은 선택된 컬럼의 데이터를 조건마다 필터링 한다. 즉, 조건1에 따라 필터링 되면 조건2에선 그나머지 데이터에 대해 필터링이 걸리고, 최종적으로 필터링 되어 하나의 컬럼으로 나타난다.
ex)
[CASE WHEN AGE <= 10 THEN '10대'
WHNE AGE <= 20 THEN '20대'
....... ELSE 값1 END] "AGE가 10이하인 경우 '10대', AGE가 20이하인 경우 '20대' ..... 나머지는 '값1'로 필터링 한다."
(이전의 조건을 일일이 적어줄 필요가 없다!)
- ORDER BY 구문은 여러 컬럼을 기준으로 정렬이 가능하다. 이때 정렬 순서는 ORDER BY구문에 가까운 순서로 먼저 정렬하며, 구분 기준을 연속으로 적을 땐 AND가 아닌 쉼표( , )를 사용한다!
- 키보드 ESC키 밑에 백틱 ( ` )키가 있다. 보통 AGE, SELECT, WHERE 같은 예약어(이미 SQL에 그 의미가 정해진 단어)를 하나의 문자열로 인식하여 사용할 때 쓰게 된다.
ex)
[SELECT COUNT(*) AS `SELECT`
FROM 테이블1] "테이블1이 가진 모든 데이터를 카운트하며, 그 컬럼의 이름을 SELECT로 별칭 부여하겠다."
2. 팀별 1주차 발제 발표 인사이트
2.1. 직무조사 발표 인사이트
- 직무 역량에 있어 하드 스킬 셋과 소프트 스킬 셋으로 구분하여 발표가 진행되었고, 현재 집중해야 할 것은 SQL, Python과 같은 하드 스킬셋임을 다시금 인지하게 되었다.
- 데이터 분석가라고 하여도 그 도메인에 따라 (비즈니스, 프로덕트, 파이넨스, 마케팅, BI, HR, 공급망) 데이터 분석가로 다양하게 불릴 수 있다는 것을 인지하였다.
- 소프트 스킬 셋 중에서 데이터 관련 직군(DA, DS, DE, CRM마케터, PM, 등등)에선 공통적으로 커뮤니케이션 능력이 언급되었다. 쉽게 말하자면 타 계열의 직군 혹은 팀원과의 협업능력이며, 그것은 자신의 인사이트를 누구나 알기 쉽게 공유하는 능력이나, 타인의 생각과 전문적 영역의 경계를 허물 수 있는 능력(타 직군에 대한 이해, 전사적 관점에서 타인의 생각을 제3자에게 전달하는 능력, 타인의 전문성을 쉽게 발휘할 수 있게 심리적 경계를 허물 수 있는 능력[밥 같이 먹고싶은 사람!] 등으로 보인다.)
- 데이터 직군이 아주 각광받는 직군임과 동시에 다양한 도메인, 업무범위로 인해 쉽게 정의할 수 없기에 다양한 채용공고를 통한 퍼포먼스 방향설정이 중요해 보인다.(사람인, 인디드, 잡코리아, 원티드, 등등)
- 단순히 데이터 관련 하드 스킬셋 외에도 AI와 관련하여 인사이트를 넓히는 것이 중요해 보인다. 흔히 AI로 일자리 대체걱정이 나타나지만 실제 팀 발표결과 일자리 대체보다 일자리의 창출, AI를 이용한 업무자동화 내지 전문화가 이어질 것으로 보인다. 즉, AI, 머신러닝, 딥러닝 등등에 대한 공부를 이어가야 할 것 같다.