為了儲存、處理及分析各式各樣規模、形式及擷取速度的資料,Microsoft Azure提供超過25種「平台即服務(PaaS)」選項,幫助使用者完整建置資料分析管線。如何為你的組織需求選定最適切的服務?本書列舉一個實用且具體的參考框架,引導你借助Azure服務,打造屬於自己的巨量資料分析解決方案。
本書作者Zoiner Tejada首先介紹諸如Lambda資料架構及資料湖等基本概念,接著帶領讀者仔細探討資料分析管線中每一階段的程式碼範例。為了幫助使用者在每一階段選擇並應用適當的Azure服務,作者利用一則貫穿全書的案例研究,引導讀者瞭解如何在現實情境中應用Azure服務及相應程式碼。
.了解如何超大規模存放資料
.設計並實作解決方案,迅速提供「熱」查詢結果,並正確產生「冷」結果。
.批次處理資料,以「即時微批次」或「一次一tuple」的方式處理串流資料。
.將機器學習功能整合到資料分析管線。
.管理、治理與保護你的資料資產。
.使用C#、Scala及Java的範例程式碼,以及現行資料分析管線內服務的原生語言
Zoiner Tejada是一位在雲端運算、大數據、資料分析及機器學習等領域中具備專業知識的軟體工程架設師。在Azure及資料平台(Data Platform)兩個領域中,Microsoft皆授與他MVP(最有價值專家)榮譽認證。
好評推薦
「如果您在設計資料分析策略時感到迷茫困惑,本書將是導引你離開無助荒野的求生指南。」 —Microsoft Azure CAT資深專案經理 Rama Ramani