運用R和Python學習50+個必學統計概念
「這本書並非是另一本統計學教科書,也不是機器學習手冊。本書透過清楚的解釋和豐富範例,將實用的統計術語及原理和當今資料探勘的行話及實務聯繫起來。對資料科學的初學者和老手來說,這都是一本非常出色的參考書。」 —Galit Shmueli, 暢銷書《Data Mining for Business Analytics》主要作者,台灣清華大學特聘教授
統計方法是資料科學很重要的部分,然而很少有資料科學家接受過正式的統計訓練,而一般的課程及書籍亦很少從資料科學的角度來講解基礎統計學。因此本書第二版新增了詳盡的Python範例,提供讀者如何將統計方法應用於資料科學的實用指南、如何避免誤用統計方法,以及該注意的建議。
資料科學的學習資源或多或少有採用統計方法,但卻缺乏更深入的統計觀點,如果你熟悉R或Python程式語言,並對統計學有所了解,那麼這本書將以易懂的方式來幫助你學習。
透過本書,你將會學習到:
‧為何探索式資料分析是資料科學關鍵的第一步
‧隨機抽樣如何減少偏誤,並產生更高品質的資料集
‧實驗設計的原理是如何針對問題得出明確的答案
‧如何使用迴歸來預測結果並檢測異常
‧用來預測紀錄所屬類別的重要分類方法
‧從資料中「學習」的統計機器學習方法
‧從無標籤資料中提取有意義訊息的非監督式學習方法