이번 강의는 python code보다는 데이터 사이언티스트의 중요한 역량으로 꼽히는 '소통 능력'과 관련된 내용을 다루고 있습니다. 데이터를 통해 유의미한 결과를 도출해내는 것도 중요하지만, 그 결과를 듣는 사람들에게 효과적인 방식으로 전달하는 것 또한 데이터 사이언티스트가 갖추어야 할 역량입니다.
1. Data storytelling
스토리텔링의 요소
Data - 발견한 점과 결과를 포함하여 실천할 수 있는 insight 도출
Visual - 간단하고, 오해의 소지가 없어야함
Narrative - 설득력 있고, 이해하기 쉬워야함
이 모든 것을 포함해 3분 이내에, 깔끔하고 정확하게 (clear and concise), 특별한 관점(unique point of view)을 보여준다면 성공적인 스토리텔링이라고 할 수 있겠습니다. 저는 이 내용을 보고 elevator speech (참고 링크 - 아사나) 가 떠올랐습니다. 사람들은 우리의 생각만큼 집중력이 좋지 않습니다. 제 스스로 집중력이 길다고 자부할 수는 없어서 공감되는 이야기인데요.. 아무튼 짧은 시간 내에 효과적으로 이야기하고자 하는 바를 각인 시킬 수 있는 스피치 방법입니다. 데이터 사이언티스트가 읽어두면 좋은 내용일 것 같아 붙여봅니다.
청중에 관해 알아두어야 할 것들
듣는 사람들의 배경 지식 (e.g 모델의 작동 방식)
듣는 사람들이 이해해야 하는 것
듣는 사람들이 필요로 하는 지식의 수준
ADEPT technique
Analogy - 이미 알고 있는 것과 새롭게 알게 된 것 간의 연결
Diagram - 시각화
Example
Plain English
Technical definition
2. Selecting the right data
"garbage in, garbage out" - 한국말로 콩 심은 데 콩 나고, 팥 심은 데 팥 난다라는 뜻이죠. 우리가 이야기를 전달하는 대상에 따라 적절한 데이터를 선택해야 효과적인 스토리텔링을 할 수 있습니다.
to Executive team (e.g CEO, investor, founder) : 데이터를 통해 얻은 결론을 활용하여 중요한 의사 결정을 할 수 있는 주체라는 점을 고려해야 합니다.
to Project manager : 회사가 원하는 방향으로 각 프로젝트를 이끌어 나가는 사람들이므로, 프로젝트 방향을 위한 구체적인 수치 및 근거를 제시해야 합니다.
to General audience : 프로젝트의 일반적인 결과물 및 영향에 관심있는 사람들, 특히 결과에 회의적인 사람들이 있을 수 있는 점을 고려해야 합니다.
Relavant statistics
절댓값 VS 비율 - 어떤 변화를 그래프로 시각화할 때, 의도를 더 잘 나타낼 수 있는 값을 선택합니다. (e.g 102 -> 104로 값이 변화한 경우와 2 -> 4로 변화한 경우 절댓값은 같지만 비율로 보았을 때 큰 차이가 남)
합계 (Aggregates) - 데이터에 대해 요약해서 보여줄 수 있는 지표로, 총합(total), 평균 및 중앙값 등을 예시로 들 수 있습니다.
p-value - 데이터에 대해 얼마나 믿을 수 있는지에 대한 값입니다.
Pros and cons of presenting
Pros
듣는 이들과 소통하며 의견을 제시할 수 있다
즉각적인 피드백을 받을 수 있다
비언어적 요소들을 통해 효과적인 전달이 가능하다
Cons
영구적인 기록이 불가능하다
내용이 너무 길어질 경우 집중력이 저하되기 때문에 모든 내용이 주목받기 어렵다
Pros and cons of written materials
Pros
communication에 대한 기록이 남게 된다
많은 사람들과 공유할 수 있다
메세지에 대한 감정적 개입이 적다
동료들과 코드를 공유하기에 더 적합하다
Cons
즉각적인 피드백, 특히 읽는 이들의 이해도에 대해서 바로 알기 어렵다
Structuring written reports
위 내용을 통해, 유관 부서와 소통할 때 presentation 과 문서를 사용하는 방법의 장단점을 알아보았습니다. 이번 챕터에서는 효과적인 소통을 위해서 문서를 구성하는 방법에 대해 이야기합니다.
Types of reports
Informational report - 짧고, 구조가 별도로 정해져있지 않으며, 사실 전달에 초점
Analytical report - 분석 내용에 대해 전달, 정해진 구조를 따르며 data-driven decision을 전달하는 것에 초점
Final report - 길이가 길고 자세한 데이터 분석 내용을 담고 있으며, 기술적인 디테일을 포함
Summary report - 길이가 비교적 짧고 (5 페이지 이내), 중요한 발견 및 시각적 자료를 포함
Report structure (for journals)
Introduction - 문서의 목적 및 개요
Body - 데이터에 대한 설명, 사용 모델 등 분석 방법, 분석 결과, 결과에 대한 평가
Conclusion - 결론에 대한 요약 및 recommendation 포함
Structure for business context
1-3-25 법칙 : 1 page of abstract, 3 pages of executive summary, 25 pages of details
Steps for report
출처 : datacamp
report를 준비하기 전 정의해야할 항목
who : 읽는 대상 (e.g HR department director)
why : 레포트 작성의 목적 (e.g important decision about salary)
content : 레포트의 핵심 내용 (e.g key findings and recommendations)
channel : 전달 방법
Planning an oral presentation
슬라이드를 구성하기 전에 purpose, audience, message를 체크해야 합니다.
Purpose - informative / instructional / persuavie
Audience - technical colleagesu / managers or executive team / customer
Message - opening statment, one thing to stick with, central message, closing statement