카테고리 없음

데이터 분석 트랙 5일차(25.02.21.) TIL

jjaio8986 2025. 2. 21. 20:59

[목차]

1. SQL 강의 인사이트 정리

2. 팀별 1주차 발제 인사이트


1. SQL 강의 인사이트 정리

<2주차 강의 인사이트(엑셀보다 쉬운 SQL 강의 + 2회차 라이브세션)>

  - MySQL을 사용한 구문에선 마지막에 세미콜론( ; )을 적기.

  - DISTINCT 구문은 뒤에 이어지는 단위군의 중복을 제거하는 의미를 담고 있다. 

   가령) COUNT(DISTINCT 컬럼1)을 할경우 컬럼1의 중복되지 않은 데이터들의 개수를 구할 수 있다.

  - WHERE 구문을 통해 연속해서 필터링하고자 할 때, 쉼표 ( , )가 아닌 조건문을 지원하는 연산자(AND, OR, NOT)를 사용해야 한다!

   [NOT의 경우 "A IS NOT B"의 형태가 아닌 "A NOT IS B"와 같이 NOT이 뒤따라 오는 대상을 부정한다! 즉, 연산기호나 값에 선행하여 작성해야 한다!]

  - 조건문을 지원하는 연산자 중에서 추가적으로 기억해야 할 것들

연산자 예시 의미
!= X!= X가 아닌 값
[NOT대신 !를 사용할 수 있다!]
BETWEEN X BETWEEN 1 AND 2 X가 값1 이상 2 이하에 해당하는 값
IS NULL X IS NULL X가 비어있는 값
IS NOT NULL X IS NOT NULL X가 비어있지 않는 값
NULL = 비어있는 값이라는 의미

 - 조건문 중 IF와 CASE문이 있다. 이 중 퍼포먼스가 가장 용이한 CASE문을 사용하는 것을 권장한다. (IF는 MySQL에서만 사용되지만 CASE는 다양한 셋에서 사용 가능하기 때문.)

 - CASE WHEN 작동 순서 : CASE WHEN은 선택된 컬럼의 데이터를 조건마다 필터링 한다. 즉, 조건1에 따라 필터링 되면 조건2에선 그나머지 데이터에 대해 필터링이 걸리고, 최종적으로 필터링 되어 하나의 컬럼으로 나타난다.

 ex)

[CASE WHEN AGE <= 10 THEN '10대'

            WHNE AGE <= 20 THEN '20대'

    ....... ELSE 값1 END] "AGE가 10이하인 경우 '10대', AGE가 20이하인 경우 '20대' ..... 나머지는 '값1'로 필터링 한다."

(이전의 조건을 일일이 적어줄 필요가 없다!)

 - ORDER BY 구문은 여러 컬럼을 기준으로 정렬이 가능하다. 이때 정렬 순서는 ORDER BY구문에 가까운 순서로 먼저 정렬하며, 구분 기준을 연속으로 적을 땐 AND가 아닌 쉼표( , )를 사용한다!

 - 키보드 ESC키 밑에 백틱 ( ` )키가 있다. 보통 AGE, SELECT, WHERE 같은 예약어(이미 SQL에 그 의미가 정해진 단어)를 하나의 문자열로 인식하여 사용할 때 쓰게 된다.

 ex)

[SELECT COUNT(*) AS `SELECT`

 FROM 테이블1] "테이블1이 가진 모든 데이터를 카운트하며, 그 컬럼의 이름을 SELECT로 별칭 부여하겠다."


2. 팀별 1주차 발제 발표 인사이트

 2.1. 직무조사 발표 인사이트

  - 직무 역량에 있어 하드 스킬 셋과 소프트 스킬 셋으로 구분하여 발표가 진행되었고, 현재 집중해야 할 것은 SQL, Python과 같은 하드 스킬셋임을 다시금 인지하게 되었다.

  - 데이터 분석가라고 하여도 그 도메인에 따라 (비즈니스, 프로덕트, 파이넨스, 마케팅, BI, HR, 공급망) 데이터 분석가로 다양하게 불릴 수 있다는 것을 인지하였다.

  - 소프트 스킬 셋 중에서 데이터 관련 직군(DA, DS, DE, CRM마케터, PM, 등등)에선 공통적으로 커뮤니케이션 능력이 언급되었다. 쉽게 말하자면 타 계열의 직군 혹은 팀원과의 협업능력이며, 그것은 자신의 인사이트를 누구나 알기 쉽게 공유하는 능력이나, 타인의 생각과 전문적 영역의 경계를 허물 수 있는 능력(타 직군에 대한 이해, 전사적 관점에서 타인의 생각을 제3자에게 전달하는 능력, 타인의 전문성을 쉽게 발휘할 수 있게 심리적 경계를 허물 수 있는 능력[밥 같이 먹고싶은 사람!] 등으로 보인다.)

 - 데이터 직군이 아주 각광받는 직군임과 동시에 다양한 도메인, 업무범위로 인해 쉽게 정의할 수 없기에 다양한 채용공고를 통한 퍼포먼스 방향설정이 중요해 보인다.(사람인, 인디드, 잡코리아, 원티드, 등등)

 - 단순히 데이터 관련 하드 스킬셋 외에도 AI와 관련하여 인사이트를 넓히는 것이 중요해 보인다. 흔히 AI로 일자리 대체걱정이 나타나지만 실제 팀 발표결과 일자리 대체보다 일자리의 창출, AI를 이용한 업무자동화 내지 전문화가 이어질 것으로 보인다. 즉, AI, 머신러닝, 딥러닝 등등에 대한 공부를 이어가야 할 것 같다.