본문 바로가기

Artificial Intelligence28

AI 논문 사이트 모음 (feat. 현업 이슈) Contents 1. 최신 AI 논문 보는 곳 2. 모든 분야 논문 정리 3. 분야별 논문 3.1. Computer Vision 논문 3.2. NLP 논문 3.3. Recommendation 논문 3.4. Tabular data 논문 4. 기업의 AI 논문 5. 논문은 아니지만 유용한 기술 블로그 1. 최신 AI 논문 보는 곳 1) 분야별 최신 논문 볼 수 있는 사이트 - paperswithcodePapers with Code - The Methods Corpus982 methods • 54838 papers with code.paperswithcode.com 2) 아직 학회에 발표되지는 않았지만 완전 최신 논문 볼 수 있는 사이트 - arxiv Arxiv Sanity Preserver arxiv-san.. 2021. 1. 30.
영어 변수명 및 약자 데이터 전처리나 모델링 시 자주 사용하는 영어 변수명/약자에 대해 정리하고 있다. 1. 도메인은 주로 prefix로 줄인다. 2. 단위나 연산, 객체 속성 등에는 자주 쓰이는 약자들이 있으니 기억하자. 3. df_season, list_season 등 해당 타입을 앞에 명시해주자. 2021. 1. 25.
One Hot Encoding의 의미와 필요성 One Hot Encoding -카테고리형 변수에 적용. 각 값에 대한 독립성을 부여하기 위함 -카테고리형 -> 수치형으로 변환하면서 생기는 수치형 값의 관계를 끊어줘서 독립적인 형태로 바꿈 -pandas의 get_dummies를 이용해 구현 -관련 질문 Q. One Hot Encoding 이란 무엇인가? 카테고리형 변수에 적용하는 전처리 방법으로, 0과 1을 사용해 각 값을 구분하는 방식입니다. 가령 한식, 중식, 일식, 양식 4가지 카테고리형 범주가 각각 0, 1, 2, 3 으로 label encoding되어 있다고 하면 해당 변수를 one hot encoding을 하지 않고 모델에 넣을 경우 중식(1)+일식(2)=양식(3)으로 해석되는 등 모델이 제대로 학습되지 않게 됩니다. 이러한 문제를 막기 위.. 2021. 1. 19.
train data / validation data / test data 차이 train data / validation data / test data 차이 - train data(=training set) : 학습을 위한 데이터, label O, feature O - test data(=test set) : 예측을 위한 데이터, label X, feature O - validation data(=validation set) : 학습 후 검증을 위한 데이터, label O, feature O, train data의 일부를 활용하며 절대 학습할 때 train에 넣으면 안됨 -관련 질문 Q. train, test, validation data의 차이? train data는 모델의 학습을 위한 데이터이고, validation data는 학습 후 검증을 위한 데이터, test data는 .. 2021. 1. 19.
분석환경 requirements 코드 작성 후 requirments.txt 개발환경, 라이선스, 버전 - 개발자: 000 - OS : window10 - 개발언어 : python 3.7 - IDE : VSCode / PyCharm - anaconda3 4.8.4 - 사용한 패키지 numpy pandas sklearn tensorflow keras pytorch matplotlib seaborn 2021. 1. 18.
Optimizer 정리 optimizer 정리 optimizer는 Gradient descent로 w를 update할 때 사용하는 알고리즘으로, w 변화량을 구해 어느 방향/스텝사이즈로 나아가야 하는지 알려주는 알고리즘. fine-tuning 단계에서 optimizer를 sgd, adam 등을 써보며 튜닝을 하는데, optimizer 역사를 살펴보면 다음과 같다. *Optimizer의 역사 GD: 전체 데이터셋을 갖고 한발자국 전진할 때마다(learning rate) 최적의 값을 찾아 나간다 모든 데이터를 계산한다 최적의 한스텝을 나아간다 -> 느리다 SGD: 일부 데이터셋만을 갖고 최적의 값을 찾아 나간다 일부 데이터만 계산한다 빠르게 전진한다 -> 그러나 최적의 값을 찾아가는 방향이 뒤죽박죽이고, local minimum에.. 2021. 1. 13.
728x90