데이터를 활용해서 기획, 분석, 시각화 등을 하는 사람들은 물론, 데이터를 보는 사람들 모두에게 데이터 문해력이 필요하다
그런 관점에서 추천받았던 데이터 문해력 책을 읽어보았다.
나는 지금까지 ‘데이터 분석 자체'를 목적으로 생각했다.
그러나, 데이터 분석에만 집중하다보니 코드도 GPT가 더 잘하고 사실상 내가 하는 부분이 많이 없다는 것을 느꼈다. 데이터와 데이터 분석은 목적을 달성하기 위한 도구에 지나지 않고, 이를 어떻게 활용할 것인지가 더 중요한 것 같았다.
그렇다면 나는 무엇을 해야하며 어떤 전문성을 갖추기 위해 노력해야 할까?를 고민했을 때 데이터 분석을 위한 기술을 익히는 것도 중요하지만 데이터를 이해하고 활용 및 기획하는 역량이 필요하다는 생각이 들었다.
데이터 문해력 (Data Literacy)
데이터를 읽고, 데이터로 일하고, 데이터로 의사결정할 수 있는 데이터 소통 능력
여기에는 올바른 결정을 내리기 위해 올바른 질문을 하고, 업무 지식을 쌓고, 의미와 맥락을 다른 사람들에게 전달하는 것이 포함
“이 그래프를 작성한 사람은 (그래프를 작성하기 전에) 무엇을 말하고 싶었을까?”
데이터 작업을 하기 전에, 애당초 무슨 말을 하고 싶은지(무엇이 알고 싶은지)를 생각해보고 이에 필요한 데이터를 활용해 작업을 진행하는 접근 방식이 필요하다.
설령 아무리 고난도의 통계와 분석 방법을 구사하더라도, 데이터가 직접적인 답을 주는 경우는 없다
“당신이 무엇을 알고 싶은지, 이를 알게 되면 무엇을 하고 싶은지, 이를 위해서는 어떤 데이터가 필요한지”를 생각할 필요가 있다
흔히 저지르는 실수
1) 풀고자 하는 문제가 명확하지 않다
2) 정의한 문제와 사용하는 데이터가 일치하지 않는다
3) 데이터에서 무엇을 알 수 있는지를 생각한다 → 데이터를 가공한다
당신이 직면하고 있는 문제나 배경에 대해 전혀 모르는 제3자가 바로 앞에 있다고 상상해라
그 사람에게 당신이 다루는 문제를 데이터로 설명하려면 무슨 데이터를 어떻게 보여주면 좋을까?
< 겉으로 드러난 현상 → 목적 및 문제를 정의 → 지표 결정 → 현재 상태 파악 → 평가 → 요인 분석 → 해결 방안 모색 >
1. 목적과 문제에 대한 정의
- 사용된 언어가 구체적이고 명확한가?
- 문제, 원인, 해결 방안을 구분하고 있는가?
→ 문제를 둘 이상의 해석이 나오지 않도록 구체적으로 표현하고 정의하였는가?
2. 지표 결정
- 목적과 문제를 정의했다면, 지표를 결정해야 한다.
- 올바른 데이터(지표)를 활용하고 있는가?
3. 현재 상태 파악 & 평가
- "사실과 결과의 데이터를 그래프나 표, 지표 등으로 표시하는 것"과 "내용을 평가해서 구체적인 행동과 판단으로 연결하는 것"을 구분해서 후자에 필요한 평가를 준비하는 것이 데이터 활용의 중요한 단계이다.
- 평가를 하기 위해 필요한 것은 ‘비교’
- 평가를 객관적으로 만드는 것은 바로 ‘다른 것과의 비교’
- 데이터를 활용해서 결과물을 만들 때, 자기 생각과 주관을 전하면 안 된다.
- 엄밀하고 객관적으로, 논리적인 주장을 전달해서 상대방이 이해할 수 있도록 해야 한다.
- 비교 시 체크포인트
- 결론으로 이어지는 결과가 나올 것인가
- 계산과 분석을 해서 나온 결과물은 결과이며, 결과가 목적에 대해 어떤 의미가 있는지 설명하는 것이 결론
- 비교를 통해 ‘차이’를 찾을 수 있는가
- 즉, ‘무슨 말을 하고 싶은지, 어떤 것을 확인하고자 하는지, 이에 따라 ㅇㅇ라는 데이터를 ㅇㅇ라는 데이터와 비교했다라는 과정이 데이터 활용에 있어서 필수
- 결과: xxx와 ooo의 차이가 있습니다
- 결론: xxx와 ooo의 차이가 존재한다는 것은, ~~ 라는 의미입니다.
해결 방안으로 뛰어들기 전, 원인을 분석해야 한다.
‘해결 방안’은 ‘문제’에 직접적으로 적용하는 것이 아니라, ‘문제’를 일으키고 있는 ‘원인’에 적용하는 것이다.
4. 원인 분석
- 왜 그 결과에 이르렀는지
- 왜 그 문제가 일어나고 있는지 파악
- 원인을 찾는 사고방식과 방법
- 원인 후보를 이끌어 내는 방법: 원인 후보를 열거한다 → 지표를 결졍한다 → 관련성을 확인한다
- 지표를 특정하는 방식
- 데이터 수집이 어려운 경우
- 유사한 데이터에는 어떤 것이 있는지 생각
- 지금 바로 수집 시작
- 정량적이 아닌, 정성적인 정보로 대응
- 포기
- 문제와 원인의 관련성 유무 확인
- 시각적으로 관련성을 확인
- 통계 지표를 확인, 상관계수 등 → 엑셀
단순히 데이터를 보는 방식이나 분석 방법론, 통계 지식만 갖고서는 객관적인 문제 해결에 전혀 도움이 되지 않는다. 동시에 꼭 필요한 것은 눈앞에 있는 데이터에 의존하지 않고 스스로 목적과 문제를 정의해 필요한 데이터나 분석 범위를 얼마나 넓은 시야로 디자인할 수 있는가이다.
데이터분석은 자신이 수립한 가설을 객관적, 논리적으로 검증하기 위한 것이라 할 수 있다.
'Activity > Data' 카테고리의 다른 글
GenAI 공공데이터 활용 경진대회 - <산업별 미스매치 예측 및 대시보드 서비스> 정리 (3) | 2024.10.13 |
---|