秋日生活
  • 電子書
大資料技術和應用 (電子書)

大資料技術和應用 (電子書)

  • 定價:354
  • 優惠價:7247
  • 優惠期限:2024年12月08日止
  • 不可銷售區域:中國
載入中...

電子書閱讀軟體

支援瀏覽器說明

APP下載:

  • 分享

優惠組合

 

內容簡介

這是一本大資料技術入門的簡明教材。全書理論和實踐相結合,以應用實戰為主,深入淺出地講解每個知識點,對每個應用實驗按學習習慣,分步驟講解,每個步驟都有文字說明和效果截圖,使讀者能清晰地知曉動手實操的效果和錯誤之處。 全書分為9章,全面介紹了大資料技術的相關基礎知識、HDFS和資料庫、採集傳輸工具、挖掘分析演算法、Spark計算框架、視覺化、大資料安全、大資料應用等內容,著重介紹了HDFS分散式檔案系統、NoSQL等各種資料庫、資料倉庫Hive,以及資料獲取分析技術,並配套了詳細的實驗教程以及練習題。 本書適合作為高等院校電腦、軟體工程、大資料專業高職、本科生的教材,同時可供企業中從事大資料開發的工程師和科技工作者參考。

 

作者介紹

陳建平

學士,大資料專家講師,福建師範大學畢業。2006年從事大資料相關的工作,2010年開始從事大資料培訓工作,15人以上的大資料團隊帶隊經驗。曾承擔過BI工程師、資料採擷工程師、大資料架構師、資料科學家、大資料技術總監、合夥人等職位,曾參與和組織過個性化推薦大資料和影像處理的人工智慧等20多個專案,曾在上海IBM公司擔任過高級資料採擷工程師。多次受邀參加學校大資料實驗室專家和高校專業論證會等。

精通大資料相關技術,熟悉關係型數據庫?racle\MySQL\DB2,熟悉Green Plum高併發資料庫;精通Hadoop、HBase、HDFS、Hive、Pig、Hue、Spark等開源技術,對即時處理Storm、SparkStreaming有較深的認識,熟悉分散式MapReduce計算引擎。精通資料採擷演算法和解決方案。熟悉SPSS\R語言\SparkMLlib\Python等挖掘語言,熟悉決策樹、K-means、神經網路、Logistc線性回歸、Apriori演算法、協同過濾等多種演算法。

熟悉零售、電信、移動、電力、證券、網路、物流、醫療、銀行等業務。

認證資質包括:CCNP、OCP、PMP、高級軟體證書、資深講師證、Cloudera管理員開發證書、高級大資料分析師證書、高級資料分析師證書等。

部分培訓過單位和學校:北京電力公司、福建電信公司、上海物流公司、蘇寧電器、中國工商銀行、上海煙草、湖北電力公司、上海IBM企業、上海汽車股份、上海電信、江西地稅、嘉興電力、上海電信、閩江學院、龍岩學院、福師大等。

已出版教材:《Cloudera Hadoop大資料平臺實戰指南》


陳志德

博士,教授。1999年畢業于福建師範大學數學系,獲學士學位;2002年畢業于福州大學數學系,獲碩士學位;2005年畢業於復旦大學電腦科學與工程系,獲博士學位;2005年至今在福建師範大學數學與電腦科學學院工作,任網路空間安全系副主任。主要研究方向包括網路與資訊安全、物聯網與移動計算等,指導碩士研究生30多人,指導研究生的學位論文曾獲校優秀碩士論文一等獎。近年來主持福建省自然科學基金、福建省科技廳K類基金等項目10項,參與國家自然科學基金和省科技廳高校產學合作科技重大專案課題各1項。出版學術專著2本,教材1本。在Journal of Computer and System Sciences、Concurrency and Computation: Practice and Experience等期刊發表學術論文40多篇,申請專利10多項,軟體著作權10多項。擔任CTCIS和NSS等國內和國際學術會議的程式委員會委員。


席進愛

上海瀚途英爍副總裁/CIO,擁有SIFM、CFA、高級大資料分析師證書。歷任上海朝陽永續股份有限公司董事/冰創科技CE?、上海大智慧基金執行總裁、上海證券通產品中心總經理。13年金融領域豐富經驗,業務涉及證券、基金、銀行、保險。主導並負責多家公司從0到1組建團隊、搭建系統和拓展業務,成功運作多起千萬級用戶平臺。目前主要致力於AI和大資料技術的落地應用,研發有智慧型機器人、智慧投研、智慧投顧和智慧行銷四大系統,帶領公司成功入選百度AI加速器第4期成員企業。

 

目錄

前言
第1章 瞭解大資料
1.1 大資料處理的基礎技術
1.1.1 大資料相關概念
1.1.2 大資料處理流程
1.1.3 大資料處理基礎技術
1.2 主流大資料技術
1.2.1 主流大資料技術各階段
1.2.2 Hadoop生態系統
1.2.3 Hadoop核心元件簡介
1.3 大資料平臺解決方案
1.3.1 Cloudera
1.3.2 Hortonworks
1.3.3 MapR
1.3.4 FusionInsight
1.3.5 Transwarp Data Hub
1.4 大資料發展現狀和趨勢
1.4.1 大資料市場規模
1.4.2 國內大資料發展面臨的問題
1.4.3 大資料發展趨勢
1.5 習題
第2章 大資料基礎軟體
2.1 Linux基礎介紹
2.1.1 用戶和用戶組管理
2.1.2 檔和目錄操作
2.1.3 文字編輯器
2.2 Java基礎介紹
2.2.1 Java基礎
2.2.2 程式設計開發
2.2.3 Java開發環境配置
2.3 SQL語言基礎介紹
2.3.1 資料庫基礎
2.3.2 SQL簡介
2.3.3 SQL語法
2.3.4 SQL基礎語法
2.4 實驗一:在Linux中安裝和使用Java
2.4.1 本實驗目標
2.4.2 本實驗知識點
2.4.3 專案實施過程
2.4.4 常見問題
2.5 實驗二:在Linux中安裝和使用MySQL
2.5.1 本實驗目標
2.5.2 本實驗知識點
2.5.3 專案實施過程
2.5.4 常見問題
2.6 習題
第3章 大資料獲取
3.1 大資料獲取技術介紹
3.2 常見採集工具和廠商
3.2.1 搜尋引擎查看
3.2.2 工具分類
3.3 八爪魚採集器介紹
3.3.1 八爪魚採集原理
3.3.2 八爪魚實現的功能
3.4 爬山虎採集器介紹
3.4.1 爬山虎介紹
3.4.2 產品特點和核心技術
3.4.3 軟體介面
3.5 流資料獲取工具Flume
3.5.1 Flume背景
3.5.2 Flume NG基本架構
3.5.3 Flume案例分析
3.6 資料傳輸工具Sqoop介紹
3.6.1 Sqoop工具介紹
3.6.2 Sqoop2特性
3.6.3 Sqoop案例
3.6.4 Sqoop問題集
3.7 實驗三:Sqoop的安裝配置及使用
3.7.1 本實驗目標
3.7.2 本實驗知識點
3.7.3 專案實施過程
3.7.4 常見問題
3.8 實驗四:Kafka的安裝、配置及使用
3.8.1 本實驗目標
3.8.2 本實驗知識點
3.8.3 專案實施過程
3.8.4 常見問題
第4章 大資料存儲
4.1 資料庫和資料倉庫
4.1.1 資料庫類型簡介
4.1.2 資料倉庫介紹
4.2 分散式檔案系統HDFS
4.2.1 HDFS介紹
4.2.2 HDFS體系結構
4.3 分散式分析引擎Kylin介紹
4.3.1 Kylin簡介
4.3.2 Kylin基本原理和架構
4.3.3 Kylin的最新特性
4.4 大資料倉庫Hive
4.4.1 Hive簡介
4.4.2 Hive體系結構
4.4.3 Hive資料存儲模型
4.4.4 Hive應用場景
4.5 NoSQL資料庫
4.5.1 NoSQL簡介
4.5.2 NoSQL在系統架構中的應用
4.6 鍵-值存儲資料庫Memcached、Redis
4.6.1 Redis基本介紹
4.6.2 Redis命令總結
4.7 面向文檔資料庫MongoDB介紹
4.7.1 MongoDB簡介
4.7.2 MongoDB深入剖析
4.8 實驗五:Hadoop的安裝、配置及HDFS使用
4.8.1 本實驗目標
4.8.2 本實驗知識點
4.8.3 專案實施過程
4.8.4 常見問題
4.9 實驗六:Redis資料庫的安裝與使用
4.9.1 本實驗目標
4.9.2 本實驗知識點
4.9.3 專案實施過程
4.9.4 常用命令及設定檔介紹
4.10 實驗七:HBase的安裝和配置
4.10.1 本實驗目標
4.10.2 本實驗知識點
4.10.3 專案實施過程
4.10.4 常見問題
4.11 習題
第5章 Spark記憶體計算框架
5.1 Spark簡介
5.2 Spark技術原理
5.2.1 Spark與Hadoop的對比
5.2.2 Spark運行架構
5.2.3 RDD基本概念
5.3 Spark SQL介紹
5.4 Spark Streaming即時處理技術
5.5 Spark MLlib資料採擷庫
5.5.1 機器學習定義
5.5.2 Spark MLlib的優勢
5.5.3 Spark MLlib支援的機器學習類型
5.6 Spark GraphX圖處理技術
5.7 Spark程式設計實例
第6章 大資料分析挖掘
6.1 大資料分析概述
6.1.1 資料分析與資料採擷的區別
6.1.2 常見資料分析挖掘工具
6.1.3 資料採擷十大演算法介紹
6.2 分類演算法概述
6.2.1 分類預測常見演算法
6.2.2 分類預測實現過程
6.3 決策樹演算法介紹
6.3.1 決策樹的定義
6.3.2 決策樹的優缺點
6.3.3 決策樹的發展
6.3.4 決策樹的構造流程
6.3.5 決策樹的相關指標
6.3.6 常見決策樹演算法
6.4 推薦演算法介紹
6.4.1 常用推薦演算法介紹
6.4.2 主要推薦方法對比
6.5 Apriori演算法介紹
6.5.1 Apriori演算法
6.5.2 頻繁項集的評估標準
6.5.3 Apriori演算法思想
6.5.4 Apriori演算法流程
6.5.5 Apriori演算法小結
第7章 大資料視覺化
7.1 大數據視覺化概述
7.1.1 數據視覺化概述
7.1.2 資料視覺化流程
7.1.3 資料視覺化展現形式
7.2 大資料視覺化工具概述
7.3 Tableau大資料視覺化技術簡介
7.4 Power BI大資料視覺化技術簡介
7.5 實驗八:ECharts的安裝與使用
7.5.1 本實驗目標
7.5.2 本實驗知識點
7.5.3 專案實施過程
7.5.4 常見問題
第8章 大資料安全
8.1 大資料安全的挑戰與對策
8.2 資料管理安全
8.3 資料安全分析
第9章 大資料應用
9.1 企業大資料應用
9.1.1 中國企業大資料現狀
9.1.2 企業大資料應用需求
9.2 互聯網大資料
9.2.1 互聯網行業擁有大資料的關鍵因素
9.2.2 大資料方案後的價值體現
9.3 零售大資料
9.4 醫療大資料
9.5 大資料未來展望
9.6 大資料和雲計算的關係
9.6.1 雲計算的特徵
9.6.2 雲計算與大資料的關係
9.6.3 雲計算及其分散式結構是重要途徑
9.6.4 雲資料庫的必然
9.6.5 雲資料庫需滿足的要求
9.6.6 雲計算能為大資料帶來的變化
參考文獻

 

前言
當前,大資料(Big Data)一詞越來越多地被提及,人們用它來描述和定義資訊爆炸時代產生的海量資料,並命名與之相關的技術發展與創新。資料正在迅速膨脹並變大,它決定著企業的未來發展,雖然現在企業可能並沒有意識到資料爆炸性增長帶來的隱患,但是隨著時間的推移,人們將越來越多的意識到資料對企業的重要性。大資料時代對人類的資料駕馭能力提出了新的挑戰,也為人們獲得更為深刻、全面的洞察能力提供了前所未有的空間與潛力。

大資料在互聯網行業指的是這樣一種現象:互聯網公司在日常運營中生成、累積的使用者網路行為資料。這些資料的規模是如此龐大,以至於不能用G或T來衡量,大資料的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。

大資料專業作為典型的“新工科”專業,在課程體系建設方面還處於摸索階段,沒有太多可供借鑒的現成經驗,需要一大批熱愛教學的高等學校教師積極投身課程體系和教材建設工作中,共同推動全國高等學校大資料教學工作不斷向前發展。

關於本書

本書定位為大資料從入門到應用的簡明系統教材,特色是理論和實踐相結合,更多的是以應用實戰為主,內容全面、深入淺出地講解了每個知識點,通俗易懂。對每個實驗基本是按照學習的習慣,分步驟式地講述,每個步驟都有文字說明和效果截圖,使得讀者能很清晰地知曉自己在動手實操過程的效果和錯誤之處,一目了然。

本書使用Apache原生態的Hadoop環境,包括關係型數據庫MySQL、分散式檔案系統HDFS、非結構化資料庫HBase、資料接入工具Kafka等元件。在撰寫過程中,參考了大量網路的資料,百度、穀歌、知乎、CSDN等知名網站,閱讀了多種大資料相關方面的文獻,對比了各自介紹文章的優勢和不足。

本書分為9章,第1章著重介紹大資料的基礎應用和發展趨勢;第2章著重介紹大資料開發所需的技術基礎,包括Linux、Java、SQL等;第3章著重介紹常見的資料獲取器以及採集工具Flume和傳輸工具Sqoop;第4章著重介紹大資料存儲相關的HDFS和NoSQL、Redis、MongoDB、Neo4j等資料庫;第5章著重介紹資料倉庫Hive和大資料採擷分析演算法及應用;第6章著重介紹了Spark計算框架的原理機制和處理技術;第7章著重介紹了大資料視覺化原理和Tebleau、Power BI等工具;第8章分析了大資料技術目前所面臨的安全挑戰及其對策;第9章對大資料技術的應用和發展做出了展望。全書提供了與章節學習內容配套的實驗,重點章節配有習題。

本書適合的讀者

本書是大資料技術的基礎用書,適合作為中職、高職、應用型本科的前導課程,在整個人才培養方案裡面屬於大資料的專業基礎課程部分,建議授課時間為第2學期或者第3學期。

本書同時也適合大資料的初學者,對大資料感興趣的技術人員,以及想從事大資料開發工作的初學者。

閱讀本書之前,讀者應該具有如下基礎:有一定電腦網路基礎知識;瞭解Linux基本原理;懂得基本的Linux操作命令;對Java語言有一定瞭解;瞭解傳統的資料庫的理論知識。

聯繫方式與資源下載

大資料技術的發展非常快速,在今後的工作中,筆者以及德明教育會持續跟蹤大資料的發展趨勢,把大資料最新的技術和本書相關補充資料及時發佈到官網,方便本書讀者通過網路及時獲取到相關資訊。由於筆者能力有限,書中難免存在不足之處,望廣大讀者能夠提出寶貴意見。

本書是完整的學校指導用書,配套資源包括課程標準、課程大綱、教學日曆、教學課件PPT、實訓手冊、習題題目和答案、期末考試卷和答案、實驗環境、教學的微課、實驗的視頻,非常方便各高校教師的授課,相關的配套資源會在德明教育官網持續更新,歡迎大家線上查看和下載。網頁地址二維碼如下:


陳建平
2020年1月

 

詳細資料

  • ISBN:9787302542193
  • 規格:普通級
  • 出版地:台灣
  • 檔案格式:EPUB流動版型
  • 建議閱讀裝置:手機、平板
  • TTS語音朗讀功能:無
  • 檔案大小:17.0MB

最近瀏覽

 

相關活動

  • 【商業理財-商業】天下文化電子書暢銷展:連結現在與未來,全展單書88折、3書79折
 

購物說明

使用電子書服務即為同意『博客來數位內容服務條款』請詳見客服中心說明。

自備暢通的網際網路連線及符合博客來支援的行動裝置、電腦作為閱讀工具,支援版本如下:

瀏覽器閱讀:無需安裝,即可閱讀。支援Safari (14以上版本)、Chrome (103以上版本) 、Edge瀏覽器 (106以上版本)。

APP閱讀:支援IOS13及Android 7以上系統。

電子書、 電子雜誌因版本屬性因素,恕無法比照紙本書籍提供MP3、DVD實體光碟,亦無提供相關影音檔案下載,請先確認無此需求再行下單購買。

請注意:

博客來電子書服務所使用之軟體程式及其支援行動裝置之可用版本隨時會更新調整,請隨時留意且主動查詢調整之內容。並請定時更新您的行動裝置作業系統版本,以確保本服務運作正常。若因個人裝置因素(如:其他應用程式衝突、裝置記憶體不足、行動裝置支援版本無法升級),無法使用博客來電子書閱讀服務或影響服務效能,需自行進行排除待符合博客來支援項目再行閱讀。

退換貨說明:

電子書購買前請務必先行試閱,不提供10天的猶豫期。

下列商品購買後博客來不提供10天的猶豫期,請務必詳閱商品說明並再次確認確有購買該項商品之需求及意願時始下單購買,有任何疑問並請先聯繫博客來客服詢問:

1.易於腐敗、保存期限較短或解約時即將逾期。
2.客製化之商品。
3.報紙、期刊或雜誌。
4.經消費者拆封之影音商品或電腦軟體。
5.下載版軟體、資訊及電子書、有聲書及影音.課程
6.涉及個人衛生,並經消費者拆封之商品,如:內衣褲、刮鬍刀…等。
7.藝文展覽票券、藝文表演票券。

  • 2024城邦年終暢銷展
  • 京都・大阪・神戶攻略完全制霸2025-2026
  • 習得安全感