[Data Warehouse Architecture]
Data Warehouse는 경영진의 의사 결정 과정을 지원하기 위하여 시간에 따라, 비 휘발성으로 저장된 주제 기반의 통합된 데이터이다. 여기에서 각각의 의미는 다음과 같다.
- 주제 기반(Subject Oriented) : 어느 조직의 데이터는 비지니스 프로세스와 목적에 따라 구성된다. 예를 들면 고객, 상품, 벤더, 판매 트랜잭션이 될 수 있다.
- 통합된(Integrated): DW는 부서간 여러 데이터를 통합한다. 부서간 데이터 소스는 특정 객체를 다른 형태로 정의할 수 있지만, DW에서는 하나의 정의로 되어 있어야 한다. (예를 들어 Product 에 대한 정의는 재고 부서와 판매 부서가 다를 수 있다.) DW에서 Name Conflict Resolution 으로 Integration 가능하다
- 비휘발성(Non-Volatile) : DW의 데이터는 변화되지 않는다. DW에 데이터가 적재되면 Data는 변동되지 않는다.
- 시간에 따른(Time-Variant) : DW의 데이터는 시간과 연관되어 있다.
- 경정진의 의사 결정 과정 지원(Support management's decision-making process) : DW의 결과물은 historical data 또는 Facts 에 기반하여 의사 결정 과정을 도와주는 것이다.
DW는 운영 시스템에서 수행할수 없는 데이터 분석과 정보의 관리를 위하여 개발되었다. 운영 시스템은 트랜잭션에 최적화 되어 있어 데이터 통합 관점의 분석이 어렵다. 이런 특성으로 Data Redundancy, Data Integration, Analysis and Performance in reporting 에 대한 문제를 야기하였다.
결과적으로 DW라는 분리된 시스템에서 여러 소스 시스템들에서 데이터를 가져오고, 이 데이터를 리포트를 위한 목적에 최적화된 방법으로 구성하며, User Friendly한 리포팅 툴로 비지니스 사용자와 의사 결정자들이 데이터를 접근할 수 있도록 하였다.
DW의 장점들
1) 분석을 위한 History Data를 보유한다. (일반적으로 운영 시스템은 History Data를 가지고 있지 않음)
2) 전사에서 하나의 데이터 접근 포인트를 제공한다
3) DW에 데이터를 변환-적재하여 클랜징 하므로 데이터의 품질을 보장한다.
4) 비지니스 및 의사결정권자가 하나의 데이터 뷰를 가지게 되어 Consistency를 보장한다.
5) 비지니스 및 의사결정권자에게 데이터보다 정보 관점을 제공한다.
6) 운영 시스템에 영향 없이 취족화된 Query Performance를 제공한다.
7) 비지니스 프로세스를 개선하기 위한 정보를 제공한다.