새소식

회고

[회고] 이어드림스쿨 2기 후기 1편

  • -
728x90

1. Intro

출처: t.ly/fx35

 4월부터 시작해서 약 9개월 간 달려왔던 AI 전문가 양성과정 이어드림스쿨이 12월 30일 자로 마무리 되었다. (3기 시작 전까지 장비도 사용 가능하고 커리어 관련해서 팔로우업이 꾸준히 있을 모양이지만 아무튼간에..) 파이썬은 둘째치고 컴퓨터는 0 또는 1만 알아듣는 기계라는 것 정도만 알고 있던 사람으로써, 솔직히 걱정이 안된다면 거짓말이었다. 멀쩡하게 다니던 회사 퇴사하고 새로운 공부를 시작한다는게 멀리서 보면 멋있는 도전이지만 가까이 보면 불안함 그 자체였다. 하지만 어쩌겠어.. 4대보험 이미 처리 끝났고 퇴직금까지 통장에 받아놓은 마당에 내가 선택한 것에 최선을 다하는 수밖에..

 나를 스스로 평가하기에 배우는 게 느린 사람은 아니지만, 개발 혹은 코딩 능력은 뇌구조가 타고나야 한다는 이상한 선입견을 가지고 있었다. 과정이 끝난 지금, 엄밀히 말해서 개발 직군은 아닌 데이터 분석 혹은 데이터 사이언티스트는 hard skill 그 이상의 무언가가 필요한 직업이라는 생각이 든다. 직관일수도 있고 특정 분야에 대한 도메인일 수도 있으나 아무튼 내가 말하고 싶은 건 '개발 실력이 엄청나게 뛰어나야만' 데이터 분야에 발을 들일 수 있는 것은 또 아니란 이야기다. (일단 글을 쓰는 나도 코딩 실력이 막 엄청난 편은 아님)

 짧은 시간이 아니었던 만큼, 기록도 할 겸 3기 하실 분들한테 도움도 될 겸 이어드림스쿨의 큰 흐름은 어땠는지, 각 phase 마다 나는 어떻게 이겨냈(?)는지 아직 기억이 있을 때 포스팅해보려고 한다. 

2. 수업 

2-1. 초급

 수강생들 중에 전공생 혹은 타 부트캠프 수료생들도 있었지만, 아무튼 초반에는 파이썬의 ㅍ 자도 모르는 진짜 초심자들만 모였다는 것을 전제로 하고 수업이 시작되었다. 개발 환경 셋팅부터 데이터 분석을 '왜' 하는지에 대한 개론, 산업에 대한 이해, 기초적인 수학 및 파이썬과 SQL 기초 등에 대해 약 2달간 수업을 들었다. 수학은 고등학교 이과 수준이라 이해하는게 어렵진 않았는데, python pandas를 처음 배우고 titanic dataset 분석하는 미니 프로젝트를 시작했을 때 그 막막함이 아직도 기억난다. 내가 부딪친 문제는 두 가지 였다. 

1. 데이터프레임에서 이렇게 자르고 저런 항목에 해당하는 것만 보고 싶은데 구현이 안됨
2. EDA를 하라는데 얼마나 더 깊게 데이터를 살펴봐야하는지 모르겠음
어쩌면 초보자들이 마주치는 당연한 문제지만 자신감 떨어지는 데 한 몫 했던 건 이미 공부를 좀 하고 와서 본인이 원하는 바를 턱턱 구현해내는 사람들이었다. EDA project를 하다가 그동안 강의를 하면서 이런 관점을 가진 수강생은 처음이라면서 강사님을 놀라게 했던 분도 있었다. 그런 분들을 보면서 세상에는 똑똑한 사람도 많고 창의적인 사람도 많구나를 느꼈다. 그런 막막함을 극복했던 방법은 별다른 건 아니고 '어쩌겠어.. 그냥 해야지' 하는 마인드였다. 안되는건 안되나보다 나중에 언젠간 다시 보자 하고 흘리고, 되는거 하고. 

 오프라인 100명, 온라인 100명을 대상으로 했기 때문에 초반에 운영적인 부분에서 삐그덕거리는 것도 없진 않았다. 조용히 다른 부트캠프로 가시는 분들도 있고 시끄럽게(?) 그만두신 분들도 있었는데, 어느 정도 인원이 정리되고 나니 오히려 평화로운 느낌이었다. 운영진 분들과 중진공 담당자분들께서 수강생 의견들을 하나하나 귀기울여 들어주셔서 감사하기도 했다. 

2-2. 중급

본격적으로 머신러닝&딥러닝 모델에 대한 수업을 시작하면서, 한달 정도의 실시간 강의&온라인 강의를 병행해 이론에 대해 공부한 뒤 프로젝트를 진행되었다. 이때쯤부터 강의 하시면서 지금 모르면 일단 넘어가세요~ 라는 말을 강사님들이 꽤나 자주 했었다. 그때는 알고 넘어가고 싶고 왜 그냥 넘어가나 조금 답답했는데 지금은 좀 알 것 같다. 전체적인 흐름을 알고나서 다시 배우면 머리에 잘 들어오는 것들이 있다. 

 머신러닝 수업에서는 이론 위주로 배웠고, 수업 자료도 거의 official documentation였다. 수식이나 글로 된 설명을 위주로 보다가 프로젝트를 시작하니까 뭐부터 건드려야할지 감도 안왔다. 강사님이 선정한 주제 중에 한 가지를 선택해서 모델링하는 프로젝트였는데, 나는 Kaggle 대회였던 카드 거래 이상 탐지 대회 를 골랐다. (이진 분류라 쉬울 줄 알았다..) 결론만 말하자면 딱히 보여줄만한 결과물이 만들어지지는 않았다. 개인사정으로 참여를 많이 못했던 팀원들도 있었고 문제 자체가 어렵기도 했다. 하지만 결과물이 없다고 배운 것도 없는 건 아니었다. 

 첫번째로는 git&github 사용법이었다. git 을 처음 써봐서 branch 가 뭔지도 모른 채 이것저것 커밋&푸쉬하다 꼬이고, 꼬인 거 풀면서 감으로 사용법을 익혔던 것 같다. 팀원 한 분은 push가 안되는 문제를 해결하려고 밤을 새신 분도 있었다.. 이렇게 한 번 지지고 볶고 해보니까 나중에 git 수업 들을 때 이해가 훨씬 빨리 됐다. 

 

Rum-j - Overview

Learning Data Science since 2022! If you are interested in my career, please check url below. You can also visit my blog - see README - Rum-j

github.com

(은근슬쩍 끼워보는 깃허브)

 두번째 배운 것은 다른 사람의 코드를 보는 것은 생각보다 어렵고 주의를 요하는 일이라는 점이다. 그냥 읽으면 될 줄 알았는데 '왜 이렇게 짰는지'를 당사자한테 묻지 않으면 이해하기 어려운 케이스도 자주 있었다. 그리고 '묻기 전에 한번만 더 읽어보자'라는 생각도 들고.. 회사 일 할때랑 다를게 없더라. 

 딥러닝 수업은 실시간 강의로 tensorflow, 온라인 강의로 pytorch에 대해 기초를 공부한 뒤에 CV/NLP/RS track을 선택해 수강하는 방식이었다. 딥러닝 모델의 구조 같은건 생각보다 정의가 쉽게 머리에 들어와서, 온라인 강의는 나중에도 들을 수 있으니 제끼고 (이러시면 안됩니다) 실시간 강의 녹화본을 돌려보면서 내용을 정리하고 포스팅했다. 티스토리로 기술 블로그를 시작하던 시점이다. 그렇게 텐서플로 기초를 뗐다고 스스로 뿌듯해할 때쯤.. 딥러닝 프로젝트 기간이 시작되었고.. 나는 파이토치 지옥에 빠졌다. 무슨 모델을 검색해서 쓰려고만 하면 다 파이토치 기반이라 모델링 코드에 대한 이해나 베이스 없이 그냥 parameter만 깨작깨작할 수 밖에 없었다. 이 글을 읽으면서 파이토치랑 텐서플로 중 뭘 먼저 공부해야하지 고민하시는 분이 있다면 나는 주저없이 파이토치를 추천드릴 것이다.

 사람의 공부에 대한 의지란 너무나도 갈대 같은 것이라서.. 미뤄둔 온라인 강의는 그때그때 필요한 부분만 듣고 기초는 M1 셋팅만 도와주려 했지만 상주하는 M1 선배로 남아버린 분의 그룹 과외로 배웠다. 온라인 강의를 듣는 것보다 솔직히 한줄한줄 이 코드가 어떤 의미인지 보면서 넘어가는게 빠른 이해에 훨씬 도움이 됐다. (참고. M1 선배의 M1 셋팅 블로그 https://velog.io/@heiswicked/series/M1Settings )

 CV track을 선택하고나서부터는 이어드림스쿨 교육과정에서 제시하는 프로젝트 대신 내가 참가하고 싶은 경진대회를 한 두개 찾아보면서 프로젝트를 대체했었던 것 같다. 일단 CV 트랙에서 강의하시는 분의 수업이 무엇을 말씀하시고자 하는지 사실 안 와닿았고.. 석사 박사 아니면 데이터 사이언스 못한다라는 강한 신념을 자꾸 수강생한테 내보이셔서 기가 좀 죽은 것도 사실이다. 포트폴리오를 위해서 좋은 task를 추천해주시긴 했지만 파이썬 외에 아무 언어도 모르는 사람들에게 혼자 해보라기엔 좀 벅찬 내용이었다. 

 이 때 강사님이 내주신 프로젝트 대신 선택한 경진대회는 당시 AI factory에서 열렸던 입자 형태 분석 대회였다.

2022.08.15 - [Study/프로젝트] - [AI factory, LG 해커톤] LG입자형태분석 대회 참가 후기

같이 코딩 테스트 스터디를 하던 친구들과 팀을 만들어서 참여했고 지금 돌아봤을 때 참가하길 잘했다라는 생각이 드는 대회이다. 흔하게 보기 힘든 데이터셋이었고 베이스라인이 MM detection으로 되어있어서 공부하기에도 좋은 코드였다.  

2-3. 고급

 8~9월부터는 Hadoop, Spark, MLOps 관련 실습들로 이루어졌다. Data engineer 직군을 희망하고 있는 사람들에게 개념을 잡기에 유용한 강의였지만, 나는 CS 적인 지식이 부족해서 따라가기 좀 벅찼다. (각 디렉토리에 읽기/쓰기 권한을 따로 설정할 수 있는 것도 linux 수업에서야 알았다.) 심지어 강의 초반쯤 코로나때문에 수업을 통으로 놓치고 나니까 아무리 녹화본으로 따라가도 머리에 잘 들어오지는 않더라. MLOps 수업은 재미있었는데 CI/CD 관련한 코드를 적용하려니까 자꾸 뭐가 안되고, ... (이하 생략) 앞에서 언급했지만 모르면 일단 넘어가는 것도 방법이다. 


생각보다 글이 길어져 1편/2편으로 나누려고 한다. 2편은 교육과정의 거의 후반부에서 수행했던 프로젝트&커리어서비스, 전체적인 총평 정도로 쓸 생각이다. 

728x90

'회고' 카테고리의 다른 글

[주간] 2023년 6주차 회고  (0) 2023.02.13
[주간] 2023년 5주차 회고  (0) 2023.02.06
[주간] 2023년 4주차 회고  (0) 2023.01.29
[주간] 2023년 3주차 회고  (0) 2023.01.21
[회고] 이어드림스쿨 2기 후기 2편  (18) 2023.01.06
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.