[ADP, ADsP] 데이터 처리 순서: Legacy -> staging -> ODS -> DW -> DM -> R, SAS, PYTHON
한때 BI 대시보드 개발을 위한 DW 구축 제안서 작업에 잠시 참여했던 적이 있다. 사실 캐글 등 해커톤에서나, 실제 현업에서는 대부분 csv로 떨궈서 데이터를 분석하지만, BI를 만들어야하거나, 대용량/실시간 데이터 처리를 해야하면 좀 복잡해진다. 데이터는 실시간으로 운영시스템에 쌓이는데, 이 데이터를 분석할 수 있도록 데이터 파이프라인을 구축해야하는 경우가 생기는데, 운영시스템에 붙어서 분석을 할 수가 없기 때문이다. 할 수는 있는데 처리 속도도 느리고, 쿼리를 잘못 날리면 모든 게 엉킬 수도 있다. 그래서 안 하는 것 같다. 그래서 OLTP로부터 OLAP을 구축하는데 (-> 사실 이건 어디까지나 batch 분석에 불과하다) ADP 시험에서는 batch 분석 정도의 개념만 묻는 듯하지만, real-t..
2020. 11. 19.