본문 바로가기

분류 전체보기106

210120(수) 부스트캠프 일지 *파이썬 자료구조 1. stack: 나중에 넣은 데이터를 먼저 반환하도록 설계된 메모리 구조. LIFO -list를 사용해 구현 2. queue : 먼저 넣은 데이터를 먼저 반환하도록 설계된 메모리 구조. FIFO -list를 사용해 구현 3. tuple : 값의 변경이 불가능한 리스트 -프로그램을 작동하는 동안 변경되지 않은 데이터 저장 시 사용 -함수의 반환 값 등 사용자의 실수에 의한 에러를 사전에 방지 4. set : 값을 순서 없이 저장, 중복 불허하는 자료형 5. dict : 데이터를 저장할 때 구분지을 수 있는 값을 함께 저장. key, value 6. deque : stack과 queue를 지원하는 모듈. 리스트에 비해 빠름 7. OrderedDict : dict와 달리, 데이터를 입력한 .. 2021. 1. 20.
210119(화) 부스트캠프 일지 수행 내역 1. 파이썬의 conditionals, loop 사용법이랑 string에 대해 배웠다. 2. 피어세션 때 오늘 강의에 대해 이해 안 되는 부분 토론했다. -python 버전별 변화 -1차 과제 궁금한 부분들 토의 3. 개인과제를 수행했다. basic_math, text processing code를 제출했다. 배운점 1. github으로 코드를 제출하는 거였는데, github 사용법을 익힐 수 있어서 좋았다. 2. 이론 강의에 대해서는 이미 아는 내용이지만 질문 받을 때 깔끔하게 답변할 수 있도록 추가로 정리를 시작해야겠다. 2021. 1. 20.
집합 연산자 개념과 종류 집합 연산자(Set Operator) 개념과 종류 두 개 이상의 테이블에서 JOIN을 사용하지 않고 연관된 데이터를 조회하는 다른 방법이 있다. 바로 집합 연산자(Set Operator)를 사용하는 방법이다. 1. 정의 집합 연산자는 2개 이상의 질의 결과를 하나의 결과로 만들어 준다. 2. 언제 사용하냐? -서로 다른 테이블에서 유사한 형태의 결과를 반환하는 것을 하나의 결과로 합치고자 할 때 -동일 테이블에서 서로 다른 질의를 수행해 결과를 합치고자 할 때 -튜닝 관점에서 실행계획을 분리하고자 할 때 3. 집합 연산자를 사용하기 위한 조건? -SELECT 절의 column 수가 동일하고 SELECT 절의 동일 위치에 존재하는 column의 datatype이 동일해야 한다. 그렇지 않으면 데이터베이스가.. 2021. 1. 20.
One Hot Encoding의 의미와 필요성 One Hot Encoding -카테고리형 변수에 적용. 각 값에 대한 독립성을 부여하기 위함 -카테고리형 -> 수치형으로 변환하면서 생기는 수치형 값의 관계를 끊어줘서 독립적인 형태로 바꿈 -pandas의 get_dummies를 이용해 구현 -관련 질문 Q. One Hot Encoding 이란 무엇인가? 카테고리형 변수에 적용하는 전처리 방법으로, 0과 1을 사용해 각 값을 구분하는 방식입니다. 가령 한식, 중식, 일식, 양식 4가지 카테고리형 범주가 각각 0, 1, 2, 3 으로 label encoding되어 있다고 하면 해당 변수를 one hot encoding을 하지 않고 모델에 넣을 경우 중식(1)+일식(2)=양식(3)으로 해석되는 등 모델이 제대로 학습되지 않게 됩니다. 이러한 문제를 막기 위.. 2021. 1. 19.
train data / validation data / test data 차이 train data / validation data / test data 차이 - train data(=training set) : 학습을 위한 데이터, label O, feature O - test data(=test set) : 예측을 위한 데이터, label X, feature O - validation data(=validation set) : 학습 후 검증을 위한 데이터, label O, feature O, train data의 일부를 활용하며 절대 학습할 때 train에 넣으면 안됨 -관련 질문 Q. train, test, validation data의 차이? train data는 모델의 학습을 위한 데이터이고, validation data는 학습 후 검증을 위한 데이터, test data는 .. 2021. 1. 19.
210118(월) 일지 # 210118 (월) -수행내역 1) 분석 환경 설치에 대한 강의를 들었고, 피어세션 회의록을 작성했습니다. 2) 분석 환경 설치에 대해서는 새로 배운 내용은 없어서 대신 requirments를 어떻게 쓸지 생각하면서 개인 자습을 했습니다. 2021/01/18 - [Artificial Intelligence] - 분석환경 requirements 분석환경 requirements 코드 작성 후 requirments.txt 개발환경, 라이선스, 버전 - 개발자: 000 - OS : window10 - 개발언어 : python 3.7 - IDE : VSCode / PyCharm - anaconda3 4.8.4 - 사용한 패키지 numpy pandas sklearn tensorf.. sohyunwriter.ti.. 2021. 1. 18.
728x90