분류 전체보기
-
Supervised learning의 종류 classification : target variable이 카테고리 Regression : target variable이 연속적인 값 용어 정리 Feature = predictor variable = independent variable = 독립 변수 Target variable = dependent variable = response variable = 종속 변수 지도 학습에 들어 가기 전에 체크해야 할 것 데이터에 결측치가 없을 것 데이터가 숫자로 이루어져 있을 것 (컴퓨터는 멍청해서 글자를 못 읽습니다.) 데이터는 pandas dataframe 혹은 numpy array 형태로 저장되어 있을 것 EDA를 수행했는지 체크할 것 Classification 분..
[Datacamp] Supervised learning with scikit-learnSupervised learning의 종류 classification : target variable이 카테고리 Regression : target variable이 연속적인 값 용어 정리 Feature = predictor variable = independent variable = 독립 변수 Target variable = dependent variable = response variable = 종속 변수 지도 학습에 들어 가기 전에 체크해야 할 것 데이터에 결측치가 없을 것 데이터가 숫자로 이루어져 있을 것 (컴퓨터는 멍청해서 글자를 못 읽습니다.) 데이터는 pandas dataframe 혹은 numpy array 형태로 저장되어 있을 것 EDA를 수행했는지 체크할 것 Classification 분..
2023.02.11 -
2023년 5주차 CLI에 익숙해지자 나는.. CLI가 아직 불편하다.. 머신러닝이든 딥러닝이든 자동화된 실험, 편한 실험을 위해서는 조금 시간이 걸리더라도 py file로 구조를 짜는 게 좋다고 강사님들이 항상 말씀하셨었지만 시간도 많이 걸리고 해서 매번 주피터로 돌아갔던 기억이 난다. 각 셀마다 결과를 바로 볼 수 있는 주피터의 단점은 실험 기록을 추적하기가 어려운 것인데, 나는 급기야 하나의 실험을 할 때마다 ipynb 파일을 복제해서 원하는 파라미터를 적용한 뒤에 모델을 돌렸다. (좋은 장비를 지원해 주셨던 이어드림스쿨에게 다시 한번 감사합니다..^_^) 하지만 회사는 혼자 실험을 하는 것도 아닌데다가 효율적으로 일해야 하는 곳이기 때문에 CLI에 익숙해져야 하는 것은 옵션이 아닌 필수가 되었다...
[주간] 2023년 5주차 회고2023년 5주차 CLI에 익숙해지자 나는.. CLI가 아직 불편하다.. 머신러닝이든 딥러닝이든 자동화된 실험, 편한 실험을 위해서는 조금 시간이 걸리더라도 py file로 구조를 짜는 게 좋다고 강사님들이 항상 말씀하셨었지만 시간도 많이 걸리고 해서 매번 주피터로 돌아갔던 기억이 난다. 각 셀마다 결과를 바로 볼 수 있는 주피터의 단점은 실험 기록을 추적하기가 어려운 것인데, 나는 급기야 하나의 실험을 할 때마다 ipynb 파일을 복제해서 원하는 파라미터를 적용한 뒤에 모델을 돌렸다. (좋은 장비를 지원해 주셨던 이어드림스쿨에게 다시 한번 감사합니다..^_^) 하지만 회사는 혼자 실험을 하는 것도 아닌데다가 효율적으로 일해야 하는 곳이기 때문에 CLI에 익숙해져야 하는 것은 옵션이 아닌 필수가 되었다...
2023.02.06 -
※문제 해석은 책 그대로 쓰지 않고 직접 합니다. 리트코드 706. 해시맵 디자인 1. 문제 Design a HashMap without using any built-in hash table libraries. 빌트인 해쉬 테이블 라이브러리를 사용하지 말고 해시맵을 디자인하세요. Implement the MyHashMap class: MyHashMap() initializes the object with an empty map. MyHashMap()은 빈 맵으로 초기화합니다. void put(int key, int value) inserts a (key, value) pair into the HashMap. If the key already exists in the map, update the corre..
[leetcode] 리트코드 706번 해시맵 디자인※문제 해석은 책 그대로 쓰지 않고 직접 합니다. 리트코드 706. 해시맵 디자인 1. 문제 Design a HashMap without using any built-in hash table libraries. 빌트인 해쉬 테이블 라이브러리를 사용하지 말고 해시맵을 디자인하세요. Implement the MyHashMap class: MyHashMap() initializes the object with an empty map. MyHashMap()은 빈 맵으로 초기화합니다. void put(int key, int value) inserts a (key, value) pair into the HashMap. If the key already exists in the map, update the corre..
2023.02.01 -
2023년 4주차 사무실 전화가 없다는 것 명함 신청을 하면서 깨달았다. 이 회사.. 내선번호가 따로 없다. 그래서 통신비 지원이 된다. 그런데 나는.. 사실 회사의 규모로 봐서는 내부 소통을 위해 슬랙을 이용하면 되고, 데이터 사이언티스트라는 직무적 특성으로 보면 회사 외부와 전화할 일이 없기 때문에 당연히 필요가 없다. 일에 집중을 하다가 전화때문에 집중이 깨진다거나, 이번엔 또 어떤 문제가 터졌을까 무서워하면서 전화 받을 일이 없다는 뜻이다. 그 말인 즉슨 내가 오히려 project manager, project leader 분들께 문제가 생겼다고 알리는 입장이 될 수도 있다는 것.. 전체적으로 보는 것도 중요하지만 내 업무를 명확히 정의하고 그것을 잘해내야 하는 것이 또다른 부담이 될 것 같다. ..
[주간] 2023년 4주차 회고2023년 4주차 사무실 전화가 없다는 것 명함 신청을 하면서 깨달았다. 이 회사.. 내선번호가 따로 없다. 그래서 통신비 지원이 된다. 그런데 나는.. 사실 회사의 규모로 봐서는 내부 소통을 위해 슬랙을 이용하면 되고, 데이터 사이언티스트라는 직무적 특성으로 보면 회사 외부와 전화할 일이 없기 때문에 당연히 필요가 없다. 일에 집중을 하다가 전화때문에 집중이 깨진다거나, 이번엔 또 어떤 문제가 터졌을까 무서워하면서 전화 받을 일이 없다는 뜻이다. 그 말인 즉슨 내가 오히려 project manager, project leader 분들께 문제가 생겼다고 알리는 입장이 될 수도 있다는 것.. 전체적으로 보는 것도 중요하지만 내 업무를 명확히 정의하고 그것을 잘해내야 하는 것이 또다른 부담이 될 것 같다. ..
2023.01.29 -
Introduction A/B testing 2013년, 게임사 EA에서는 출시된 게임의 사전예약 건수를 높이기 위해서 두 가지 광고 전략을 세웁니다. contrl group/treament group으로 케이스를 나누어 유저들에게 어떤 광고가 더 잘 먹히는지 관찰하는 것을 A/B testing이라고 합니다. 하지만, A/B testing을 통해 얻은 결론이 단순히 우연의 일치일지 혹은 통계적으로 유의미한 값인지 검증하는 과정도 필요합니다. 이번 챕터에서는 이런 검증 과정에 대해 배워봤습니다. #generating a bootstrap distribution import numpy as np boot_dist = [] for i in range(5000): #the number of samplings b..
[Datacamp] Hypothesis tests and z-scores (1)Introduction A/B testing 2013년, 게임사 EA에서는 출시된 게임의 사전예약 건수를 높이기 위해서 두 가지 광고 전략을 세웁니다. contrl group/treament group으로 케이스를 나누어 유저들에게 어떤 광고가 더 잘 먹히는지 관찰하는 것을 A/B testing이라고 합니다. 하지만, A/B testing을 통해 얻은 결론이 단순히 우연의 일치일지 혹은 통계적으로 유의미한 값인지 검증하는 과정도 필요합니다. 이번 챕터에서는 이런 검증 과정에 대해 배워봤습니다. #generating a bootstrap distribution import numpy as np boot_dist = [] for i in range(5000): #the number of samplings b..
2023.01.28 -
공고 내용 : K-startup 홈페이지 지원 링크: https://yeardream.ninehire.site/ 중소벤처기업진흥공단 글로벌창업사관학교 - 채용 홈페이지 중소벤처기업진흥공단 글로벌창업사관학교 채용 홈페이지입니다. yeardream.ninehire.site 중소기업진흥공단, 이하 중진공에서 이어드림스쿨 3기 모집 공고를 여셨습니다! 1. 이어드림스쿨이란? 이어드림스쿨은 AI기술인력의 수요가 늘어나고 있는 데 비해, 공급이 부족해 인력난을 겪고 있는 스타트업과 청년 인재 사이의 미스매치 해소를 위한 교육과정입니다. ChatGPT의 핫한 데뷔(?)로 인해 인공지능에 대해 관심을 가진 분들이 더 늘어났을 것 같은데, 10개월 교육 들으면 저런 거 개발할 수 있나요?라고 물으시면 당연히 아닙니다....
[공고] 이어드림스쿨 3기 모집 공고공고 내용 : K-startup 홈페이지 지원 링크: https://yeardream.ninehire.site/ 중소벤처기업진흥공단 글로벌창업사관학교 - 채용 홈페이지 중소벤처기업진흥공단 글로벌창업사관학교 채용 홈페이지입니다. yeardream.ninehire.site 중소기업진흥공단, 이하 중진공에서 이어드림스쿨 3기 모집 공고를 여셨습니다! 1. 이어드림스쿨이란? 이어드림스쿨은 AI기술인력의 수요가 늘어나고 있는 데 비해, 공급이 부족해 인력난을 겪고 있는 스타트업과 청년 인재 사이의 미스매치 해소를 위한 교육과정입니다. ChatGPT의 핫한 데뷔(?)로 인해 인공지능에 대해 관심을 가진 분들이 더 늘어났을 것 같은데, 10개월 교육 들으면 저런 거 개발할 수 있나요?라고 물으시면 당연히 아닙니다....
2023.01.28 -
주간 회고를 시작한 이유 2019년부터 아이패드에 weekly diary 속지를 다운받아서 다이어리를 써왔다. 쓰면서 느낀 점은 '생각보다 1년은 짧다'였다. 52주라고 한꺼번에 말하면 더 짧아 보인다. 연말이 되면서 남은 주가 얼마 남지 않을수록 올해 어떻게 살았는지에 대한 반성이 떠올랐다. 내년에는 더 알차게 살았다는 뿌듯함을 느끼거나, 혹시나 도대체 뭘 하고 살았는데 일 년이 지나갔나 하는 생각이 들면, 그에 대한 답변을 만들기 위해 주간 트래커 회고를 적어보려고 한다. 기술 블로그의 의의를 다하기 위해서 커리어 및 업무 위주로. 2023년 3주차 온보딩 살면서 처음 해보는 1시간 이상의 통근에 아찔함도 잠시.. 아침에 정신 잘 차리는 타입이 아니라 오히려 저녁에 좀 한산해진 지하철을 타고 퇴근하는..
[주간] 2023년 3주차 회고주간 회고를 시작한 이유 2019년부터 아이패드에 weekly diary 속지를 다운받아서 다이어리를 써왔다. 쓰면서 느낀 점은 '생각보다 1년은 짧다'였다. 52주라고 한꺼번에 말하면 더 짧아 보인다. 연말이 되면서 남은 주가 얼마 남지 않을수록 올해 어떻게 살았는지에 대한 반성이 떠올랐다. 내년에는 더 알차게 살았다는 뿌듯함을 느끼거나, 혹시나 도대체 뭘 하고 살았는데 일 년이 지나갔나 하는 생각이 들면, 그에 대한 답변을 만들기 위해 주간 트래커 회고를 적어보려고 한다. 기술 블로그의 의의를 다하기 위해서 커리어 및 업무 위주로. 2023년 3주차 온보딩 살면서 처음 해보는 1시간 이상의 통근에 아찔함도 잠시.. 아침에 정신 잘 차리는 타입이 아니라 오히려 저녁에 좀 한산해진 지하철을 타고 퇴근하는..
2023.01.21 -
Regression 이란? explanatory variable(설명변수 혹은 독립변수, X)와 response variable(반응변수 혹은 종속변수, Y) 간의 관계를 통계적으로 예측하는 모델. Types of regression Linear regression : response variable이 실수형인 경우 Logistic regression : response variable이 논리형, 즉 참/거짓으로 판정되는 경우 #watch the relation between two variables import seaborn as sns sample_df = sns.load_dataset('taxis', cache=True, data_home=None) # 설명 t.ly/aymd sns.regplot(..
[Datacamp] Introduction to Regression with statsmodelsRegression 이란? explanatory variable(설명변수 혹은 독립변수, X)와 response variable(반응변수 혹은 종속변수, Y) 간의 관계를 통계적으로 예측하는 모델. Types of regression Linear regression : response variable이 실수형인 경우 Logistic regression : response variable이 논리형, 즉 참/거짓으로 판정되는 경우 #watch the relation between two variables import seaborn as sns sample_df = sns.load_dataset('taxis', cache=True, data_home=None) # 설명 t.ly/aymd sns.regplot(..
2023.01.19