반응형



지은이: 네이선 마츠 , 제임스 워렌 지음

옮긴이: 김영준, 이도경, 정재부 옮김 

펴낸곤:  정보문화사

출간일:  2016년 01월 15일


람다 아키텍쳐는 빅데이터 분석 시스템 구조에 있어서 실시간 분석과 배치 분석을 동시에 활용하는 아키텍처이다.


데이터라고 하는 것은 데이터가 생성된 이후부터는 변화하지 않는(Immutable) 다는 특성을 가지고 있다. 이 데이터로 부터 가공되어지는 정보 또는 분석 결과는 사람과 시스템에 따른 오류가 발생 가능하기 떄문에 데이터는 원본 그대로 저장하고, 배치 분석을 통해서 사람이 보고자 하는 가공된 정보를 만들어 놓는 거이다. 그리고 이 가공된 정보(이 책에서는 서비스 레이어라고 칭한다)는 언제든지 데이터 원본들을 이용해서 재구성할 수 있어 한다.


실시간 분석은 배치 분석 사이의 간극을 매워주는 것이다. 배치 분석 주기가 하루라고 한다면 이 하루 시간에 대해서 실시간 분석을 통해서 가공된 정보를 구성해 준다. 실시간 분석 시스템은 배치 분석 시스템에 비하여 시스템 구조가 복잡하기 때문에 오류에 치명적이 될 수 있다. 그래서 배치 분석의 간극을 매워주는 기능만을 커버해주면 된다. 데이터는 실시간 분석과 배치 분석 시스템 모두로 흘러들어가며, 배치 분석 시스템에서는 모든 데이터를 저장하여 배치 분석과 복구에 대비한다. 실시간 분석 시스템은 복잡하지만 아주 짧은(배치 분석에 비해) 영역만을 담당하기 때문에 오류에 대한 피해를 최소화 할 수 있다.


아키텍처라는 것이 어떤 역활을 해줄수 있으며 아키텍처를 잘 정의하는 것이 문제 해결에 어떤 영향을 미칠 수 있을지 잘 느낄수 있게 해주는 책이다.

반응형
Posted by alias
,