분류 전체보기
-
패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. 식별자의 개념 엔터티를 대표할 수 있는 유일성을 만족하는 속성 엔터티 안의 각 인스턴스를 구분할 수 있는 이름 e.g 고객번호, 상품번호, 주민등록번호, 계좌번호 데이터베이스 키의 종류 후보키 condidate key 유일성과 최소성을 만족하는 키 기본키 primary key 엔터티를 대표할 수 있는 키 슈퍼키 super key 유일성은 만족하지만 최소성을 만족하지 않는 키 대체키 alternate key 여러 개의 후보키 중에서 기본키를 선정하고 남은 키 외래키 foreign key 한 개 이상의 다른 테이블의 기본 키 필드를 가리키는 것 참조 무결성(referential integrity)를 확인하기 위해 사용 허용된 데이터 값만 데이터베..
[SQLD] 1-3. 식별자 Identifiers패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. 식별자의 개념 엔터티를 대표할 수 있는 유일성을 만족하는 속성 엔터티 안의 각 인스턴스를 구분할 수 있는 이름 e.g 고객번호, 상품번호, 주민등록번호, 계좌번호 데이터베이스 키의 종류 후보키 condidate key 유일성과 최소성을 만족하는 키 기본키 primary key 엔터티를 대표할 수 있는 키 슈퍼키 super key 유일성은 만족하지만 최소성을 만족하지 않는 키 대체키 alternate key 여러 개의 후보키 중에서 기본키를 선정하고 남은 키 외래키 foreign key 한 개 이상의 다른 테이블의 기본 키 필드를 가리키는 것 참조 무결성(referential integrity)를 확인하기 위해 사용 허용된 데이터 값만 데이터베..
2023.03.04 -
패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. Entity 엔터티 업무에서 관리해야 하는 관심사, 데이터 집합 개념, 사건, 장소 등의 명사 인스턴스의 집합 * (엔터티는 원소, 인스턴스는 원자라고 생각하면 이해가 쉬울 듯) 엔터티의 특징 식별자가 있어야 함 2개 이상의 인스턴스가 존재하는 집합 속성을 가져야 함 다른 엔터티와 최소 한개 이상 관계가 있어야 함 업무에서 관리되어야 함 = 업무 프로세스에 의해 이용되어야 함 엔터티의 분류 유형과 무형에 따른 분류 유형 e.g 고객, 사원 업무에서 도출되며 지속적으로 사용하는 엔터티 물리적인 형태가 있고 업무로부터 엔터티를 구분하기 가장 용이 개념 e.g 종목, 상품 개념적 정보로 구분되는 엔터티 물리적인 형태가 없음 사건 e.g 주문, 취소..
[SQLD] 1-2. Entity/Attribute/Relationship패스트캠퍼스 강의와 이기적 기본서를 기반으로 공부합니다. 1. Entity 엔터티 업무에서 관리해야 하는 관심사, 데이터 집합 개념, 사건, 장소 등의 명사 인스턴스의 집합 * (엔터티는 원소, 인스턴스는 원자라고 생각하면 이해가 쉬울 듯) 엔터티의 특징 식별자가 있어야 함 2개 이상의 인스턴스가 존재하는 집합 속성을 가져야 함 다른 엔터티와 최소 한개 이상 관계가 있어야 함 업무에서 관리되어야 함 = 업무 프로세스에 의해 이용되어야 함 엔터티의 분류 유형과 무형에 따른 분류 유형 e.g 고객, 사원 업무에서 도출되며 지속적으로 사용하는 엔터티 물리적인 형태가 있고 업무로부터 엔터티를 구분하기 가장 용이 개념 e.g 종목, 상품 개념적 정보로 구분되는 엔터티 물리적인 형태가 없음 사건 e.g 주문, 취소..
2023.03.03 -
9월 중순부터 시작해 2월까지 달려온 가짜연구소 5기 펠로우쉽 Data scientist with Python 스터디가 마무리되었습니다. 데이터캠프라는 코딩학습 플랫폼의 수강권을 제공받아 일주일에 한 챕터씩 공부하고, 순서를 정해서 혹은 당일에 랜덤으로 발표자를 정해서 공부한 내용을 공유하는 방식으로 진행되었어요. 수업 자체는 파이썬 초~중급 수준으로 몰라서 못하겠다!라는 내용은 없었지만, 공부뿐만 아니라 공부 외적인 것으로도 얻은 것이 많아 만족스러웠던 스터디였습니다. 가짜연구소 스터디에 참여한 것은 이어드림스쿨에서 공부하면서 옆 자리에 앉았던 친구가 알려준 것이 계기가 되었습니다. 주중에 하는 공부로도 정신이 없긴 했지만, 기술적인 공부보다는 다른 사람들은 어떤 것을 배우고 어떻게 활용하는지 보고 싶..
[스터디] 가짜연구소 5기 펠로우쉽 후기9월 중순부터 시작해 2월까지 달려온 가짜연구소 5기 펠로우쉽 Data scientist with Python 스터디가 마무리되었습니다. 데이터캠프라는 코딩학습 플랫폼의 수강권을 제공받아 일주일에 한 챕터씩 공부하고, 순서를 정해서 혹은 당일에 랜덤으로 발표자를 정해서 공부한 내용을 공유하는 방식으로 진행되었어요. 수업 자체는 파이썬 초~중급 수준으로 몰라서 못하겠다!라는 내용은 없었지만, 공부뿐만 아니라 공부 외적인 것으로도 얻은 것이 많아 만족스러웠던 스터디였습니다. 가짜연구소 스터디에 참여한 것은 이어드림스쿨에서 공부하면서 옆 자리에 앉았던 친구가 알려준 것이 계기가 되었습니다. 주중에 하는 공부로도 정신이 없긴 했지만, 기술적인 공부보다는 다른 사람들은 어떤 것을 배우고 어떻게 활용하는지 보고 싶..
2023.02.27 -
안녕하세요, 럼지입니다. 올해 SQLD 시험을 보고 앞으로도 꾸준히 SQL 공부를 하기 위해 카테고리를 신설해 봤어요. SQLD 포스팅은 패스트캠퍼스 합격의 하이패스: SQLD 자격 과정을 참고로 할 예정입니다. 수업 내용을 온전히 써놓기 보다는 키워드 위주로, 혹은 시험을 위해 같이 알아두면 좋은 내용도 최대한 포함해 포스팅하려고 합니다. 데이터 모델의 이해 모델링의 정의: 복잡한 현실세계를 "추상화, 단순화, 명확화"하여 데이터 모델로 표현하는 것 모델링 특징 추상화: 현실세계를 일정한 형식에 맞추어 표현 단순화: 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현 명확화: 누구나 이해하기 쉽도록 정확하게 현상을 기술 모델링의 세 가지 관점 데이터 관점: 데이터와 관련된 업무 혹은 ..
[SQLD] 1-1. 데이터 모델링의 이해 개요 키워드안녕하세요, 럼지입니다. 올해 SQLD 시험을 보고 앞으로도 꾸준히 SQL 공부를 하기 위해 카테고리를 신설해 봤어요. SQLD 포스팅은 패스트캠퍼스 합격의 하이패스: SQLD 자격 과정을 참고로 할 예정입니다. 수업 내용을 온전히 써놓기 보다는 키워드 위주로, 혹은 시험을 위해 같이 알아두면 좋은 내용도 최대한 포함해 포스팅하려고 합니다. 데이터 모델의 이해 모델링의 정의: 복잡한 현실세계를 "추상화, 단순화, 명확화"하여 데이터 모델로 표현하는 것 모델링 특징 추상화: 현실세계를 일정한 형식에 맞추어 표현 단순화: 복잡한 현실세계를 약속된 규약에 의해 제한된 표기법이나 언어로 표현 명확화: 누구나 이해하기 쉽도록 정확하게 현상을 기술 모델링의 세 가지 관점 데이터 관점: 데이터와 관련된 업무 혹은 ..
2023.02.26 -
이번 강의는 python code보다는 데이터 사이언티스트의 중요한 역량으로 꼽히는 '소통 능력'과 관련된 내용을 다루고 있습니다. 데이터를 통해 유의미한 결과를 도출해내는 것도 중요하지만, 그 결과를 듣는 사람들에게 효과적인 방식으로 전달하는 것 또한 데이터 사이언티스트가 갖추어야 할 역량입니다. 1. Data storytelling 스토리텔링의 요소 Data - 발견한 점과 결과를 포함하여 실천할 수 있는 insight 도출 Visual - 간단하고, 오해의 소지가 없어야함 Narrative - 설득력 있고, 이해하기 쉬워야함 이 모든 것을 포함해 3분 이내에, 깔끔하고 정확하게 (clear and concise), 특별한 관점(unique point of view)을 보여준다면 성공적인 스토리텔링이..
[Datacamp] Data communication concept이번 강의는 python code보다는 데이터 사이언티스트의 중요한 역량으로 꼽히는 '소통 능력'과 관련된 내용을 다루고 있습니다. 데이터를 통해 유의미한 결과를 도출해내는 것도 중요하지만, 그 결과를 듣는 사람들에게 효과적인 방식으로 전달하는 것 또한 데이터 사이언티스트가 갖추어야 할 역량입니다. 1. Data storytelling 스토리텔링의 요소 Data - 발견한 점과 결과를 포함하여 실천할 수 있는 insight 도출 Visual - 간단하고, 오해의 소지가 없어야함 Narrative - 설득력 있고, 이해하기 쉬워야함 이 모든 것을 포함해 3분 이내에, 깔끔하고 정확하게 (clear and concise), 특별한 관점(unique point of view)을 보여준다면 성공적인 스토리텔링이..
2023.02.20 -
2023년 7주차 회고 데이터셋의 GT 기준 정하기 입사한 지 얼마 안됐지만, 회사와 팀의 방향성을 정하고 그것을 뒷받침할 수 있는 프로젝트를 하나 맡게 되었다. (쪼금.. 부담스러워..) 본부장님과 팀장님이 잘 해내려고 많이 신경 쓰시는 게 티가 나서 덩달아 힘줘서 일하게 된다. 완전 처음부터 내부적인 세팅을 해야 되는 프로젝트라 'bounding box 및 segmentation의 참값을 어떻게 지정할 것인가'에 대해서 프로젝트를 같이 맡게 된 팀원과 회의를 꽤 길게 했다. 예를 들어 사진 상에 사람을 class로 해서 레이블링을 한다면, 그 사람이 우산을 들고 있다면 우산까지 box를 치는지 아니면 우산에 가려진 사람만 box를 치는지 하는 아주 애매하고 디테일하지만 누군가는 정해야 것들.. 이런저..
[주간] 2023년 7주차 회고2023년 7주차 회고 데이터셋의 GT 기준 정하기 입사한 지 얼마 안됐지만, 회사와 팀의 방향성을 정하고 그것을 뒷받침할 수 있는 프로젝트를 하나 맡게 되었다. (쪼금.. 부담스러워..) 본부장님과 팀장님이 잘 해내려고 많이 신경 쓰시는 게 티가 나서 덩달아 힘줘서 일하게 된다. 완전 처음부터 내부적인 세팅을 해야 되는 프로젝트라 'bounding box 및 segmentation의 참값을 어떻게 지정할 것인가'에 대해서 프로젝트를 같이 맡게 된 팀원과 회의를 꽤 길게 했다. 예를 들어 사진 상에 사람을 class로 해서 레이블링을 한다면, 그 사람이 우산을 들고 있다면 우산까지 box를 치는지 아니면 우산에 가려진 사람만 box를 치는지 하는 아주 애매하고 디테일하지만 누군가는 정해야 것들.. 이런저..
2023.02.19 -
2023년 6주차 운동 시작 플라잉 요가를 사랑하는 요기니에서 헬스 초보로 타이틀이 바뀌었다. 여전히 요가를 사랑하지만 퇴근 시간이 너무 애매해서 보통 정시에 시작하는 수업을 듣기 어려울 것 같아 종목을 바꿨다. 회사 앞에 있는 헬스장을 다닐까 하다가, 운동하고 집에 가서 바로 뻗을 수 있도록 집 앞의 피트니스에 피티를 등록했다. 사실 체험수업만 들으려고 했는데 생각보다 수업 퀄리티가 괜찮아서 쿨하게 결제함..ㅎㅎ 작년에 이어드림스쿨 하면서 부실하게 먹느라 살이 꽤 빠졌었는데, 인바디를 재니까 아니나 다를까 근육이 쭉쭉 빠진 상태였다. 오래 앉아있을 수밖에 없는 직업을 가지게 된 이상 생존을 위해서라도 운동을 해야겠다는 생각이 들었다. 운동의 가장 큰 매력은 '오로지 나에게 집중하는 시간'을 가진다는 점..
[주간] 2023년 6주차 회고2023년 6주차 운동 시작 플라잉 요가를 사랑하는 요기니에서 헬스 초보로 타이틀이 바뀌었다. 여전히 요가를 사랑하지만 퇴근 시간이 너무 애매해서 보통 정시에 시작하는 수업을 듣기 어려울 것 같아 종목을 바꿨다. 회사 앞에 있는 헬스장을 다닐까 하다가, 운동하고 집에 가서 바로 뻗을 수 있도록 집 앞의 피트니스에 피티를 등록했다. 사실 체험수업만 들으려고 했는데 생각보다 수업 퀄리티가 괜찮아서 쿨하게 결제함..ㅎㅎ 작년에 이어드림스쿨 하면서 부실하게 먹느라 살이 꽤 빠졌었는데, 인바디를 재니까 아니나 다를까 근육이 쭉쭉 빠진 상태였다. 오래 앉아있을 수밖에 없는 직업을 가지게 된 이상 생존을 위해서라도 운동을 해야겠다는 생각이 들었다. 운동의 가장 큰 매력은 '오로지 나에게 집중하는 시간'을 가진다는 점..
2023.02.13 -
Clustering for dataset exploration 이번 챕터에서는 비지도 학습과 함께 데이터를 전처리하는 내용에 대해서 다루었습니다. sample data로는 Iris dataset를 자주 사용했는데요, iris dataset은 4개의 feature(petal length, petal width, sepal length, sepal width)와 3 종류의 label (setosa, versicolor, virginica)을 가지고 있는 데이터입니다. K-means clustering #K means clustering from sklearn.cluster import KMeans model = KMeans(n_clusters=3) #iris datset = 3 speceis model.fi..
[Datacamp] Unsupervised learning in PythonClustering for dataset exploration 이번 챕터에서는 비지도 학습과 함께 데이터를 전처리하는 내용에 대해서 다루었습니다. sample data로는 Iris dataset를 자주 사용했는데요, iris dataset은 4개의 feature(petal length, petal width, sepal length, sepal width)와 3 종류의 label (setosa, versicolor, virginica)을 가지고 있는 데이터입니다. K-means clustering #K means clustering from sklearn.cluster import KMeans model = KMeans(n_clusters=3) #iris datset = 3 speceis model.fi..
2023.02.12