카테고리 없음

데이터 분석 트랙 39일차 25.04.08. [TIL]

jjaio8986 2025. 4. 8. 20:33

[목차]

  • 아티클 정리
  • SQL 코드카타 재귀쿼리와 결측값을 채워주는 쿼리문

 


  • 아티클 정리 "A/B테스트 제대로 이해하기3 : A/B테스트 계산기의 세팅과 해석"

https://yozm.wishket.com/magazine/detail/1656/

 

A/B 테스트 제대로 이해하기: 3 A/B 테스트 계산기의 세팅과 해석 | 요즘IT

앞선 두 편의 글에서, ‘실제 A/B 테스트를 설계할 때 우리가 진짜 궁금한 질문’과 ‘A/B 테스트 실험 결과의 유의미한 방안’, 그리고 ‘이를 바탕으로 A/B 테스트의 설계 및 해석에 필요한 기초

yozm.wishket.com

 - 내용 요약 : SPSS나 파이썬, 엑셀이 아니라도 간단한 숫자 입력 및 세팅으로 테스트 계산을 제공하는 웹 서비스도 있다. 그러한 웹서비스에서도 필수적으로 요구하는 실험 세팅 요소들이 있다.

표본 크기 설정”, “신뢰수준 및 우연도 설정”, “최종 실험 결과 예측 모델링”, “가설 설정이 주 요소이다.

 

특히 가설 설정에 있어 양측 검정과 단측 검정의 방식이 있다. 각각 실험결과에서 차이의 존재 확인”, “차이가 어떠한 인과관계를 갖는다를 의미하며 후자의 경우 과감하고, 극명한 접근 및 확인조건이 필요하기에 전자[양측 검정]의 방법이 흔히 쓰인다.

 

결과를 해석함에 있어 유의미한 결과[대립가설 채택 혹은 기각]가 나와도 좋지만 유의미한 결과가 나오지 않았을 때 실험 목적인 대립 가설 설정상의 문제?’, ‘실험 표본 설정의 문제?’ 등 다양한 요인을 고려하여 가설이 잘못된 이유를 확인하여 다시 테스트해볼 수 있다.

 

 - 주요 포인트 : 실험 설계 시 중요한 것들과 결과 해석에 있어 유의성이 어떻게 작용하는가

 

 - 인사이트 : 유의미한 결과가 나오지 않았다고 하여 실험을 거기서 종료하는 것이 아니라 실험의 설계상의 문제인지, 가설 자체의 문제인지 등등 다양한 원인을 확인하여 실험을 계속 이어나가야 한다. 그렇기에 확인하고자 하는 실험의 목적! 최종적으로 보여주고자 하는 목표를 정확히 확인해야 다양한 실험 상에도 지치지 않고 꾸준히 여러 요인을 확인할 수 있을 것이다.

  즉, 유의미하지 않다고 실험을끝내지 말고 끝까지 밀고 나아가는 집중력초기 가설 설정의 중요성을 체감하게 되었다.

 


  • SQL 코드카타 재귀쿼리와 결측값을 채워주는 쿼리문

 1. 재귀쿼리 : 'WITH RECURSIVE'작성 후 내부에 UNION을 통해 재귀를 구성한다!

<코드 구현>

WITH RECURSIVE 쿼리명1 AS (
-- NON-RECURSIVE문장 첫 루프에서만 실행 --
           SELECT 시작 숫자 AS 별칭1
           UNION ALL

 -- RECURSIVE 문장 :읽을 때마다 행의 위치가 기억돼 다음번 읽어올 때 다음 행으로 이동 --
           SELECT 별칭1+1 AS 최종적으로 표현하고자 하는 별칭
           FROM 쿼리명1
-- 반복할 횟수 --
           WHERE 별칭1 < 23   
          )

2. 결측값을 대체하는 쿼리문
<코드 구현>

SELECT *, ifnull(결측값 있는 컬럼, 결측값을 대체할 숫자 혹은 단어)

FROM 테이블 1