새소식

Info

데이터 사이언티스트 Data scientist 직무 설명, 역량, 포트폴리오

  • -
728x90

 안녕하세요, 럼지입니다!

 저는 취업 이후 사석에서 사람들을 만나러 갈 때 항상 명함을 챙겨가는 편인데요, 명함을 드리고 나면 데이터 사이언티스트가 무엇인지에 대한 질문을 많이 받습니다. 가족, 친구, 나아가 데이터 분야로의 이직을 원하시는 분들께 제가 어떤 일을 하는지 설명드리긴 하지만 용어가 생소하고 '딥러닝 모델'이라는 단어가 머릿속에서 구체화되기 어려운 만큼 구두 설명으로만 들어서는 잘 와닿지 않습니다. 그래서 (비전공자 현직자가) 정리해 보는 데이터 사이언티스트의 모든 것 - 직무 설명, 역량, 포트폴리오 구성에 대한 포스팅입니다. 

출처: t.ly/AdTxq

데이터 사이언티스트란? - 직무 정의 및 설명

 데이터 사이언티스트 직무를 한 문장으로 설명하자면, 빅데이터를 이용하여 문제를 해결하기 위해 머신러닝/딥러닝 모델을 활용하는 사람입니다. 하지만 단순히 모델링만 하는 건 '사이언티스트'가 아니어도 할 수 있는 일입니다. 데이터 사이언티스트는 문제를 찾고, 그 문제를 해결하기 위해 모델을 활용해 실험을 수행하고, 실험 결과를 통해 인사이트를 얻어 문제의 해결방안을 제시할 줄 알아야 합니다. 이런 일련의 과정을 수행하기 위해서는 모델을 활용하는 컴퓨팅적 스킬도 필요하지만, 도메인에 대한 충분한 이해 또한 필요합니다. 다양한 배경 지식이 필요한 직업이라 개인적으로 T자형 인재가 되어야 한다는 말이 와닿는 직무입니다. 

이 외에 great learinng blog에서 설명하는 데이터 사이언티스트의 주요 롤은 아래와 같습니다. 

  • 데이터 수집 자동화 및 관리
  • 데이터 처리(data processing), 데이터 오류 관리(data cleansing), 데이터 통합(data intergrating) 등
  • 데이터 사이언스 테크닉을 활용한 프로세스 개선
  • 빅데이터 분석하여 트렌드를 파악, 아이디어 제시
  • 비즈니스, 엔지니어링, 프로덕트 팀과의 협업

데이터 사이언티스트가 되기위해 필요한 역량

1. 하드 스킬

  • 언어 (Python (numpy, pandas, scikit-learn, tensorflow, pytorch 등 관련 패키지), R, SQL 등)
  • domain knowledge (업계에 대한 이해)
  • 통계학적 지식 
  • 대용량 데이터 처리에 대한 이해 

 이렇게 역량에 대해 리스팅을 하면, 가끔 '나는 리스트 중에 반절은 해당 안되니까 더 공부를 해야지 취업할 수 있겠다'라고 좌절을 하시는 분들이 많은데, 어디까지나 케이스 바이 케이스, 회사 바이 회사입니다. 가고자 하는 회사의 공고의 필요 역량을 잘 살펴보시고, 다 갖추지 못했더라도 이 회사에 일을 하고 싶다! 하시면 포트폴리오를 잘 준비하셔서 지원하세요. 기회는 두드리는 사람에게 열려 있습니다. 

2. 소프트 스킬

  • 커뮤니케이션 능력

데이터 사이언티스트가 일을 하려면 데이터, 그것도 충분히 많은 양의 데이터가 필요합니다. 필요한 데이터를 수집하기 위해서 뿐만 아니라, 얻은 데이터를 올바르게 활용하기 위해서, 데이터로부터 얻은 인사이트를 팀에 공유하기 위해서 등등 다양한 협업을 위해 회사 내의 기획자, 개발자, 마케터 등 많은 팀과의 소통이 있어야겠죠. 저는 특히 다른 사람들을 '설득'하는 것이 주요 업무 중 하나라고 생각하기 때문에, 데이터 사이언티스트라면 꼭 갖춰야 하는 스킬입니다.

  • 도메인에 대한 이해 

 사실 데이터 자체는 숫자에 지나지 않습니다. 숫자들을 모아서 그 특성들을 분석하고 활용하려면 각각의 숫자들이 어떤 의미인지 파악하기 위한 배경 지식과 산업에 대한 이해가 있어야 합니다. 이를 흔히 도메인이라고 많이 표현하는데, 짧은 시간 내에 쌓기 어려운 경험을 통해 얻을 수 있기 때문에 전문가의 도움을 받아야 하는 영역이라고 생각합니다. 

  • 학습 능력

 인공지능 분야는 그 기술이 따라가기 어려울 정도로 발전하고 있습니다. 새롭게 나오는 기술에 대해 항상 흥미와 궁금증을 가지고 트렌드에 관심을 가지며, 해결해야 하는 문제에 적용할 수 있는지 고민하는 태도가 필요합니다. 

Q. 비전공자는 데이터 사이언티스트로 취업하기 힘든가요? 

 데이터 사이언티스트 직무를 위한 '전공'은 딱히 정해져 있지 않다는 게 개인적인 생각입니다. 굳이 꼽자면 산업공학과 혹은 컴퓨터공학과, 통계학과가 있겠습니다. 학부가 관련 전공이신 분들은 데이터 사이언스의 기초가 되는 과목들에 대해 더 많은 시간을 쏟았을 것이고, 산학과제 등을 통해 포트폴리오를 구성하기 유리한 프로젝트들에 대한 접근성이 좋을 것입니다. 하드 스킬을 쌓기 좋은 환경이지요.

하지만 소프트 스킬을 쌓기 위해 꼭 전공자일 필요는 없습니다. 오히려 회사 내에서의 커뮤니케이션 스킬이나 산업을 바라보는 관점은 회사를 다녀본 경험이 있으신 분들께 더 유리한 점입니다. 본인이 가지고 있는 강점을 데이터 사이언티스트의 필요 역량과 잘 연결해 서류와 면접을 준비한다면 충분히 가능한 영역이라고 생각합니다. (다만.. 2023년 취업 시장이 얼어붙었다는 점은 역량과 관련 없이 우리를 힘들게 하는 요소입니다.)

데이터 사이언티스트의 포트폴리오

 본인이 참여한 모든 프로젝트와 대회에 대한 내용을 세세하게 기록해 엄청난 양의 포트폴리오를 준비하시는 분들도 있고, 참여한 프로젝트가 너무 적어서 이대로도 취업이 될까 걱정하시는 분들도 많습니다. 저는 포트폴리오를 구성할 때 아래 항목들을 고려하시는 것을 추천드리고 싶습니다. 

1) 내가 이 프로젝트에서 기여한 바에 대해서 명확하게 설명할 수 있는가?

2) 문제 인식과 데이터 활용, 제시한 해결 방안이 논리적으로 명확한가?

 내가 '왜', '무엇을 하고 싶어서' 이 프로젝트를 수행했고, 이 경험에 지원한 회사에 어떻게 도움이 될지 면접에서 잘 설명할 수 있다면 듣는 입장에서는 이 회사에 필요한 사람이라는 인상을 받을 수 있겠죠. 그렇기 때문에 포트폴리오에 넣을만한 요소가 너무 많으신 분이라면, 회사와 관련된 주제의 프로젝트만 넣는 것이 좋습니다. 


 이상으로 데이터 사이언티스트란 무엇인지, 어떤 역량을 갖추어야 하는지, 어떤 포트폴리오를 준비해야 하는지 정리해 보았습니다. 짧은 경험을 기반으로 한 주관이 들어가 있는 글입니다. 정정 요청과 다른 의견 제시를 환영합니다! 

728x90
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.