2025.02.11. 내일배움캠프(사전캠프) 6, 7일차
목차
1. 아티클 요약 - 그 데이터는 잘못 해석되었습니다
2. 아티클 요약 - 데이터 리터러시(Data Literacy)를 올리는 방법
1. 아티클 요약 - 그 데이터는 잘못 해석되었습니다
[주제]
- 데이터 해석에 발생하는 오류들과 옳은 해석 방법
[목차]
- 데이터 해석 시 발생하는 오류
1. 생존자 편향의 오류
2. 심슨의 역설
3. 상관관계를 통한 성급한 일반화
4. 목적에 맞지 않는 지표 선택
- 올바른 해석 방법 ‘세이건 표준’
[아티클 요약]
- 데이터를 통해 의사 결정을 함에 있어 다양한 문제들과 오류가 등장한다. ‘지표 설정’ 단계에서 문제가 생겨 발생하는 ‘생존자 편향의 오류’, 해석함에 있어 분석하고자 하는 대상의 성질이 쉽게 정의되지 않아 발생하는 ‘심슨의 역설’, ‘성급한 일반화의 오류’나 ‘목표 설정’에 따른 해석의 오류가 발생한다.
데이터를 해석하며 이러한 문제 상황을 예방하기 위해선 ‘지표 설정’, ‘문제 분석 및 목표 설정’을 명확하게 해야 하며, 해석함에 있어 세이건 표준’을 참고하는 것 또한 하나의 올바른 해석 방법 중 하나라고 할 수 있다.
[인사이트]
- 데이터 분석에 ‘통계학’이나 ‘논리학’에서 볼 수 있었던 다양한 오류들과 문제 상황들이 등장해 새삼 놀라웠다. 왜 데이터 분석 프로세스에서 ‘답변 필요 질문 인식’과 ‘데이터 정제’ 과정이 핵심적이고 오래 걸리는 지 이해하게 되었고, 참고할 만한 데이터 분석 및 해석 기준이 있어 다행이라는 생각이 들었다.
2. 아티클 요약 - 데이터 리터러시(Data Literacy)를 올리는 방법
[주제] ‘데이터 리터러시(Data Literacy)’
- ‘데이터 리터러시’와 그를 위한 필요 요건들
[목차]
- ‘데이터 리터러시’의 정의 및 필요조건
- 데이터/실험 기반 사고방식
- 분석 흐름대로 데이터를 탐색할 수 있는 환경
- 데이터 분석가
[아티클 요약]
- ‘데이터 리터러시’(Data Literacy)의 정의
- ‘데이터 리터러시’란 ‘데이터를 활용해 문제를 해결할 수 있는 능력’이라 정의할 수 있다. 이전까지 기업 내 조직은 ‘데이터 활용’을 단순히 “관련 데이터를 본다.”라는 생각을 가지고 있어, 데이터 제공의 신속성, 정확성에 초점을 맞춰왔다. 그로 인한 문제가 발생했는데 “‘해결 할 문제’나 ‘실제 실행’과 무관하거나 너무 많은 데이터 요청 및 제공”이 바로 그것이다.
- 따라서 이러한 문제를 해결하고, ‘데이터를 잘 활용’하기 위해선 조직은 ‘데이터 리터러시’가 필요하고, 이를 위해 다음의 3가지 요건이 필요하다.
- 데이터/실험 기반 사고방식의 확립
- 가장 먼저 데이터를 활용하기 위해선 단순히 데이터의 군집을 보는 것이 아니라 우선 그 기반이 되는 사고방식(데이터를 대하는 관점)을 확립하는 것이 필요하다. 가령 ‘해결 할 문제는 무엇’이고, ‘그것 해결할 솔루션은 무엇’이고, ‘데이터 속에서 그것을 측정할 지표는 무엇’인지를 생각하고, 설정하는 것이 바로 그것이다. 조직은 이러한 생각(‘문제 정의’, ‘솔루션’, ‘측정지표’)을 통해 데이터 활용을 위한 요건을 확보할 수 있다.
- 분석 흐름대로 데이터를 탐색할 수 있는 환경
- 조직 구성원이 앞선 사고방식이 확립되어도 데이터를 활용할 수 있는 환경이 필요할 것이다. ‘데이터 맵’이나 ‘대시 보드’와 같이 데이터 속에서 ‘문제’와 ‘솔루션’, ‘측정 지표’에 대응하는 것들을 탐색할 수 있는 환경이 구축되어야 ‘데이터 활용’을 할 수 있을 것이다.
- 데이터 분석가
- ‘데이터/실험 기반 사고방식의 확립’과 ‘탐색 환경’을 구축하기 위한 데이터 분석가의 존재가 필요할 것이다. 데이터 분석가는 위의 사고방식 확립과 환경 구축(데이터 플랫폼)에 도움을 줄 것이고, 조직의 성장에 따른 구성원의 업무 지표의 설정, 효율성, 데이터 환경을 구축할 수 있기 때문이다.
[인사이트]
- 아티클의 사례를 통해 조직과 그 구성원을 위해 데이터 분석가가 할 수 있는 역할, ‘데이터 리터러시’가 무엇이고 그를 위한 필요조건이 무엇인지 알 수 있었다. 데이터 분석가는 ‘데이터 자체를 보는 것’이 아니라 ‘데이터를 가지고 무엇을 할 지’에 초점을 두어야 하고 그를 위해 ‘문제 정의 - 솔루션 - 측정지표’라는 사고방식과 실제 데이터에서 그것을 확인하기 위한 로드맵(데이터 맵) 제작을 연습해야겠다는 생각이 들었다.
☆ 아티클 전체 인사이트) 아티클들을 통해 "데이터를 보고 의사결정을 내린다." 라는 것이 하나의 트렌드처럼 보여지나, 실제 현업에서 "이것이 일반적인 인식인가?"에 관해서는 의문이 든다. 데이터 분석과 그 결과에 대한 '제공' 자체는 실제 현장에서 그것을 요구하는 사람들에게 익숙해보인다. 하지만 데이터 분석가가 할 수 있는 '역할'이나 '역량'에 대한 인식은 구체적이지 않아 보이며, 그로 인한 걱정(ex."데이터의 활용"을 위한 경영진 및 조직 구성원의 적극적인 참여와 같은 "데이터 분석 환경" 조성의 불리)이 생긴다. 즉, 데이터분석가의 현업에서의 인식 수준이 어느 정도인지, 아티클의 사례처럼 성공적인 데이터 리터러시 환경구축 사례가 많은지(데이터 분석가의 역할을 주도적 혹은 적극적으로 확장할 수 있는지)에 관한 의문이 생긴다.