‧精簡的設定和範例介紹,快速掌握Apache NiFi核心精髓
‧整合當今主流的資料工程架構與相關服務說明
‧掌握資料流設計的特性與重點,踏出資料工程第一步
本書介紹Apache NiFi這套服務工具,讀者可以於該服務設計自動化處理資料流(Data Pipeline)。所有的設計與設定都是以No Code與WEB UI方式處理,具備強大的操作互動性和易用性。另外支援大多數的資料載體,如:Relational Database、Document DB、Column-Based、DataWarehouse 、Message Queue等對接處理,並支援目前主流的三大雲平台-AWS(Amazon Web Service)、GCP(Google Cloud Platform)和Microsoft Azure,涵蓋大部分企業使用到的應用與服務,都可透過Apache NiFi做到一站式整合與資料流設計,確保資料處理邏輯以及流入和流出的方向和目的地。同時在面對大量資料處理時也可以運用高擴展的特性來平行執行,也能更細節地去追蹤資料的變化與狀態,最後做到完整的流程與錯誤控制以避免產生資料遺漏的窘境。
本書會介紹當今在資料工程常見的架構,接著介紹Apache NiFi的架構與元件、建置流程與設定、操作方式、與外部服務的整合和應用、資料追蹤等各個資料工程常見的應用處理。最後會提及資料工程領域的發展和重點分析,讓對於這塊領域較陌生或有興趣的讀者們,除了可以在本書學到Apache NiFi的核心價值之外,也能意識到該領域的後續發展與重點,給予讀者具體方向進行未來的發展和準備。