推薦序
一本簡單易懂的「統計學故事書」
「資料科學家的工作日常」粉專版主/張維元
資料科學曾被譽為「21 世紀最性感的工作」,更是許多公司在數位轉型時十分重要的一環。近年來,數據科學或資料科學成為企業擴編的新寵,也有越來越多公司希望數位轉型之後,可以利用數據來幫助經營者即時的決策。隨著雲端與大數據的技術逐漸成熟,數據科學已然成為數位時代下不得不具備的技能。
然而,資料科學其實不是全新的技術,其中最核心的基礎「統計學」(Statistics),就是從過去持續發展至今、且已融入各行各業的重要解法。統計學作為數據科學中的基石,能夠「從資料中萃取出資訊」用以幫助決策,學好這門學問更是建立數據科學思維的第一步。統計學是由數學發展而來,可以區分為敘述統計和推論統計兩種類型,依其性質可再分為理論統計學與應用統計學。從探索過去、了解現在到預測未來,統計思考脈絡一共可以分成五個層次。
不過,對許多人來說,統計學總是存在一道無形的門檻,其中用到的數學公式往往令人卻步。你是否也曾擔心自己數學差,沒辦法學好統計或是資料科學?如果我們能跳脫應付考試的學習,試著從生活案例中解釋統計學,你會發現它其實沒有想像中的可怕與困難。
本書《7小時,統計學從天書變故事書》運用了大量日常生活中的經驗作為案例,每個單元都從日常的情境出發,從觀察到思考、再帶出統計學所扮演的角色。而所謂的數據思維,也稱得上是一種從「我覺得」到「看數據說話」的解決問題策略。簡單來說,就是當你面對一堆數據與圖表時,你該如何思考與推論、進而決策?如果我們始終仰賴經驗與主觀的判斷,便很難實現系統性的成長。
統計學是一種歸納法,能夠從累積的資料中觀察趨勢,讓我們從資料中「鑑往知來」,而不再只是主觀的判斷。更重要的是,我們能夠藉由學習統計學所培養的敏銳度,更精準的解讀資料,避免陷入資料的盲點與誤區。本書利用了許多有趣且好理解的案例,例如「倖存者偏差」、「隨機對照實驗」,到各種統計值的計算與圖表視覺化的解讀。除了在每一個單元幫你建立觀念,最後一個章節中也準備了幾個真實的情境,讓你思考如何有效的運用統計學。
統計學與數據科學不再只是理工人的專屬技能,早已成為數據時代下必須掌握的數位能力。如果你正在尋找一本讀得懂的統計學書籍,這本「故事書」,你一定會喜歡。
前言
說服別人的最快方法:根據統計
一提到「數據分析」一詞,就會很不可思議的,不自覺的把「分析數據」當作是最後的目的(我也是如此)。但「分析」本身不應是你的目的。因為分析數據,只不過是為了達成某種目的的手段而已。
當然,目的會因人而異。若是在企業內部,大多數人的目的應該是找出自身公司的瓶頸並一一解決,以創造利潤。
用比較貼近生活的例子來看,如果你正因與鄰居之間的糾紛而煩惱(例如樓上住戶半夜十分吵鬧,讓你睡不著覺等),那麼你的終極目的,想必就是解決這個問題。
反過來一想,不管你蒐集了多少數據(或資訊)來分析,如果無法解決問題,那就毫無幫助。
換句話說,數據分析永遠都有其「目的」,而且會追求「結果」。從這個含意來看,是否用了什麼高級的方法,或者是否利用電腦之類的工具,其實在數據分析上並不重要。
我以前任職的小型企業也是一樣,課長在開會前,會發幾十張A3 大小的數據資料(從左上到右下塞滿圖表)。從這個例子就知道,即便是小公司,數據也是要多少有多少,但很少有人可以在閱讀數據報表之後,便立刻指出「這裡是不是怪怪的」,立刻找到問題點。
在這種時候,需要的第一個工具就是「圖表化」。以豐田(TOYOTA)公司的用語來說,就是可視化,只要把數據轉換成適當的圖表,就連我這樣的普通人,也能看得懂。
數據分析的第一步,就是把適當的數據替換成適當的圖表。「圖表」的強項在於比較,這種工具可以協助人類更直覺的理解情況。
然而,即便靠圖表、在直覺上找出了問題點,光是這樣仍然無法說服其他人。原因在於,當你徵求他們的認同:「看這張圖表,可以得知這兩個數據是有關連的,對吧?」如果對方不太認同:「是這樣嗎?」雙方就不會有交集。
因為只靠圖表,就說服的層面來說,還缺乏力量。
下一個階段,必須用每個人都能同意的數字來設定範圍、做出區隔。換言之,就是「有根據的區隔」──為此,你所需要的強力工具,就是初階的「統計學」。
但統計學,甚至是統計分析的工具,是非常廣泛、艱深的世界。因此最好盡快學會「常態分布」(還有許多其他類型的分布),而且要會使用畫一條線來思考的「迴歸分析」。這兩者都有「用機率來思考」和「用數字來區隔」的概念,只要透過它們來表達,想必就能增加說服力。
有些企業會招募數據科學家,徹底分析企業內的問題點。但你應該比這些數據科學家,更清楚自己公司的瓶頸。
還記得我一開頭提到的嗎?沒錯,數據分析的目的,不是分析,而是達到目的。你想解決的目的是什麼,你自己最清楚。
接下來,就是知道擁有哪些數據(資訊),以及該如何用它們解決問題。這一點與其藉助數據科學家的幫助,不如各位自己來學習,並善用幾個簡單的工具。
本書不會使用艱澀的分析方法,希望能透過解讀數據、學習避免被偏見誤導的訣竅,以及簡單的統計方法,協助你達到目的。