Study
-
패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. 식별자의 개념 엔터티를 대표할 수 있는 유일성을 만족하는 속성 엔터티 안의 각 인스턴스를 구분할 수 있는 이름 e.g 고객번호, 상품번호, 주민등록번호, 계좌번호 데이터베이스 키의 종류 후보키 condidate key 유일성과 최소성을 만족하는 키 기본키 primary key 엔터티를 대표할 수 있는 키 슈퍼키 super key 유일성은 만족하지만 최소성을 만족하지 않는 키 대체키 alternate key 여러 개의 후보키 중에서 기본키를 선정하고 남은 키 외래키 foreign key 한 개 이상의 다른 테이블의 기본 키 필드를 가리키는 것 참조 무결성(referential integrity)를 확인하기 위해 사용 허용된 데이터 값만 데이터베..
[SQLD] 1-3. 식별자 Identifiers패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. 식별자의 개념 엔터티를 대표할 수 있는 유일성을 만족하는 속성 엔터티 안의 각 인스턴스를 구분할 수 있는 이름 e.g 고객번호, 상품번호, 주민등록번호, 계좌번호 데이터베이스 키의 종류 후보키 condidate key 유일성과 최소성을 만족하는 키 기본키 primary key 엔터티를 대표할 수 있는 키 슈퍼키 super key 유일성은 만족하지만 최소성을 만족하지 않는 키 대체키 alternate key 여러 개의 후보키 중에서 기본키를 선정하고 남은 키 외래키 foreign key 한 개 이상의 다른 테이블의 기본 키 필드를 가리키는 것 참조 무결성(referential integrity)를 확인하기 위해 사용 허용된 데이터 값만 데이터베..
2023.03.04 -
패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. Entity 엔터티 업무에서 관리해야 하는 관심사, 데이터 집합 개념, 사건, 장소 등의 명사 인스턴스의 집합 * (엔터티는 원소, 인스턴스는 원자라고 생각하면 이해가 쉬울 듯) 엔터티의 특징 식별자가 있어야 함 2개 이상의 인스턴스가 존재하는 집합 속성을 가져야 함 다른 엔터티와 최소 한개 이상 관계가 있어야 함 업무에서 관리되어야 함 = 업무 프로세스에 의해 이용되어야 함 엔터티의 분류 유형과 무형에 따른 분류 유형 e.g 고객, 사원 업무에서 도출되며 지속적으로 사용하는 엔터티 물리적인 형태가 있고 업무로부터 엔터티를 구분하기 가장 용이 개념 e.g 종목, 상품 개념적 정보로 구분되는 엔터티 물리적인 형태가 없음 사건 e.g 주문, 취소..
[SQLD] 1-2. Entity/Attribute/Relationship패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. Entity 엔터티 업무에서 관리해야 하는 관심사, 데이터 집합 개념, 사건, 장소 등의 명사 인스턴스의 집합 * (엔터티는 원소, 인스턴스는 원자라고 생각하면 이해가 쉬울 듯) 엔터티의 특징 식별자가 있어야 함 2개 이상의 인스턴스가 존재하는 집합 속성을 가져야 함 다른 엔터티와 최소 한개 이상 관계가 있어야 함 업무에서 관리되어야 함 = 업무 프로세스에 의해 이용되어야 함 엔터티의 분류 유형과 무형에 따른 분류 유형 e.g 고객, 사원 업무에서 도출되며 지속적으로 사용하는 엔터티 물리적인 형태가 있고 업무로부터 엔터티를 구분하기 가장 용이 개념 e.g 종목, 상품 개념적 정보로 구분되는 엔터티 물리적인 형태가 없음 사건 e.g 주문, 취소..
2023.03.03 -
안녕하세요, 럼지입니다. 올해 SQLD 시험을 보고 앞으로도 꾸준히 SQL 공부를 하기 위해 카테고리를 신설해 봤어요. SQLD 포스팅은 패스트캠퍼스 합격의 하이패스: SQLD 자격 과정을 참고로 할 예정입니다. 수업 내용을 온전히 써놓기 보다는 키워드 위주로, 혹은 시험을 위해 같이 알아두면 좋은 내용도 최대한 포함해 포스팅하려고 합니다. 데이터 모델의 이해 모델링의 정의: 복잡한 현실세계를 "추상화, 단순화, 명확화"하여 데이터 모델로 표현하는 것 모델링 특징 추상화: 현실세계를 일정한 형식에 맞추어 표현 단순화: 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현 명확화: 누구나 이해하기 쉽도록 정확하게 현상을 기술 모델링의 세 가지 관점 데이터 관점: 데이터와 관련된 업무 혹은 ..
[SQLD] 1-1. 데이터 모델링의 이해 개요 키워드안녕하세요, 럼지입니다. 올해 SQLD 시험을 보고 앞으로도 꾸준히 SQL 공부를 하기 위해 카테고리를 신설해 봤어요. SQLD 포스팅은 패스트캠퍼스 합격의 하이패스: SQLD 자격 과정을 참고로 할 예정입니다. 수업 내용을 온전히 써놓기 보다는 키워드 위주로, 혹은 시험을 위해 같이 알아두면 좋은 내용도 최대한 포함해 포스팅하려고 합니다. 데이터 모델의 이해 모델링의 정의: 복잡한 현실세계를 "추상화, 단순화, 명확화"하여 데이터 모델로 표현하는 것 모델링 특징 추상화: 현실세계를 일정한 형식에 맞추어 표현 단순화: 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현 명확화: 누구나 이해하기 쉽도록 정확하게 현상을 기술 모델링의 세 가지 관점 데이터 관점: 데이터와 관련된 업무 혹은 ..
2023.02.26 -
이번 강의는 python code보다는 데이터 사이언티스트의 중요한 역량으로 꼽히는 '소통 능력'과 관련된 내용을 다루고 있습니다. 데이터를 통해 유의미한 결과를 도출해내는 것도 중요하지만, 그 결과를 듣는 사람들에게 효과적인 방식으로 전달하는 것 또한 데이터 사이언티스트가 갖추어야 할 역량입니다. 1. Data storytelling 스토리텔링의 요소 Data - 발견한 점과 결과를 포함하여 실천할 수 있는 insight 도출 Visual - 간단하고, 오해의 소지가 없어야함 Narrative - 설득력 있고, 이해하기 쉬워야함 이 모든 것을 포함해 3분 이내에, 깔끔하고 정확하게 (clear and concise), 특별한 관점(unique point of view)을 보여준다면 성공적인 스토리텔링이..
[Datacamp] Data communication concept이번 강의는 python code보다는 데이터 사이언티스트의 중요한 역량으로 꼽히는 '소통 능력'과 관련된 내용을 다루고 있습니다. 데이터를 통해 유의미한 결과를 도출해내는 것도 중요하지만, 그 결과를 듣는 사람들에게 효과적인 방식으로 전달하는 것 또한 데이터 사이언티스트가 갖추어야 할 역량입니다. 1. Data storytelling 스토리텔링의 요소 Data - 발견한 점과 결과를 포함하여 실천할 수 있는 insight 도출 Visual - 간단하고, 오해의 소지가 없어야함 Narrative - 설득력 있고, 이해하기 쉬워야함 이 모든 것을 포함해 3분 이내에, 깔끔하고 정확하게 (clear and concise), 특별한 관점(unique point of view)을 보여준다면 성공적인 스토리텔링이..
2023.02.20 -
Clustering for dataset exploration 이번 챕터에서는 비지도 학습과 함께 데이터를 전처리하는 내용에 대해서 다루었습니다. sample data로는 Iris dataset를 자주 사용했는데요, iris dataset은 4개의 feature(petal length, petal width, sepal length, sepal width)와 3 종류의 label (setosa, versicolor, virginica)을 가지고 있는 데이터입니다. K-means clustering #K means clustering from sklearn.cluster import KMeans model = KMeans(n_clusters=3) #iris datset = 3 speceis model.fi..
[Datacamp] Unsupervised learning in PythonClustering for dataset exploration 이번 챕터에서는 비지도 학습과 함께 데이터를 전처리하는 내용에 대해서 다루었습니다. sample data로는 Iris dataset를 자주 사용했는데요, iris dataset은 4개의 feature(petal length, petal width, sepal length, sepal width)와 3 종류의 label (setosa, versicolor, virginica)을 가지고 있는 데이터입니다. K-means clustering #K means clustering from sklearn.cluster import KMeans model = KMeans(n_clusters=3) #iris datset = 3 speceis model.fi..
2023.02.12 -
Supervised learning의 종류 classification : target variable이 카테고리 Regression : target variable이 연속적인 값 용어 정리 Feature = predictor variable = independent variable = 독립 변수 Target variable = dependent variable = response variable = 종속 변수 지도 학습에 들어 가기 전에 체크해야 할 것 데이터에 결측치가 없을 것 데이터가 숫자로 이루어져 있을 것 (컴퓨터는 멍청해서 글자를 못 읽습니다.) 데이터는 pandas dataframe 혹은 numpy array 형태로 저장되어 있을 것 EDA를 수행했는지 체크할 것 Classification 분..
[Datacamp] Supervised learning with scikit-learnSupervised learning의 종류 classification : target variable이 카테고리 Regression : target variable이 연속적인 값 용어 정리 Feature = predictor variable = independent variable = 독립 변수 Target variable = dependent variable = response variable = 종속 변수 지도 학습에 들어 가기 전에 체크해야 할 것 데이터에 결측치가 없을 것 데이터가 숫자로 이루어져 있을 것 (컴퓨터는 멍청해서 글자를 못 읽습니다.) 데이터는 pandas dataframe 혹은 numpy array 형태로 저장되어 있을 것 EDA를 수행했는지 체크할 것 Classification 분..
2023.02.11 -
※문제 해석은 책 그대로 쓰지 않고 직접 합니다. 리트코드 706. 해시맵 디자인 1. 문제 Design a HashMap without using any built-in hash table libraries. 빌트인 해쉬 테이블 라이브러리를 사용하지 말고 해시맵을 디자인하세요. Implement the MyHashMap class: MyHashMap() initializes the object with an empty map. MyHashMap()은 빈 맵으로 초기화합니다. void put(int key, int value) inserts a (key, value) pair into the HashMap. If the key already exists in the map, update the corre..
[leetcode] 리트코드 706번 해시맵 디자인※문제 해석은 책 그대로 쓰지 않고 직접 합니다. 리트코드 706. 해시맵 디자인 1. 문제 Design a HashMap without using any built-in hash table libraries. 빌트인 해쉬 테이블 라이브러리를 사용하지 말고 해시맵을 디자인하세요. Implement the MyHashMap class: MyHashMap() initializes the object with an empty map. MyHashMap()은 빈 맵으로 초기화합니다. void put(int key, int value) inserts a (key, value) pair into the HashMap. If the key already exists in the map, update the corre..
2023.02.01 -
Introduction A/B testing 2013년, 게임사 EA에서는 출시된 게임의 사전예약 건수를 높이기 위해서 두 가지 광고 전략을 세웁니다. contrl group/treament group으로 케이스를 나누어 유저들에게 어떤 광고가 더 잘 먹히는지 관찰하는 것을 A/B testing이라고 합니다. 하지만, A/B testing을 통해 얻은 결론이 단순히 우연의 일치일지 혹은 통계적으로 유의미한 값인지 검증하는 과정도 필요합니다. 이번 챕터에서는 이런 검증 과정에 대해 배워봤습니다. #generating a bootstrap distribution import numpy as np boot_dist = [] for i in range(5000): #the number of samplings b..
[Datacamp] Hypothesis tests and z-scores (1)Introduction A/B testing 2013년, 게임사 EA에서는 출시된 게임의 사전예약 건수를 높이기 위해서 두 가지 광고 전략을 세웁니다. contrl group/treament group으로 케이스를 나누어 유저들에게 어떤 광고가 더 잘 먹히는지 관찰하는 것을 A/B testing이라고 합니다. 하지만, A/B testing을 통해 얻은 결론이 단순히 우연의 일치일지 혹은 통계적으로 유의미한 값인지 검증하는 과정도 필요합니다. 이번 챕터에서는 이런 검증 과정에 대해 배워봤습니다. #generating a bootstrap distribution import numpy as np boot_dist = [] for i in range(5000): #the number of samplings b..
2023.01.28