前言
若想利用數據創造變化
很多看了《解讀數據的技術》(編按:作者前作,已由樂金文化發行)的讀者這麼問我:
「現在我知道數據很重要,可是要先從哪裡著手呢?」
我把好幾年前就想說的內容寫進了那本書,也以為我把所有能講的,都說完了,然而事實並非如此。想分析數據的讀者,各有不同的期待,其中也有不少人想從頭開始學習。
很多人會想:「一本談論數據的書,應該會教我新技術或是如何寫程式吧!」但是《解讀數據的技術》一書中,並沒有所謂的「初學者也能輕鬆上手的機器學習」這類技術內容,我想應該有不少讀者大失所望。其實市面上已經有許多比我更懂技術的專業人士,所出的書籍和課程,我並不是為了寫出一本與眾不同的技術性書籍才提筆寫作。
只要讀過一本統計相關專業書籍,加上一本最新技術書籍,然後再看影片教學,無論用什麼方法,只要親自嘗試撰寫程式,終究可以學會。但我知道也有很多人表示:「從眾多免費資訊中,嘗試各種方法後,是有辦法寫出一點程式,但實際上要怎麼應用,就不知道了。」這本書恰好可以為這些人做進一步的說明。不過,要是連相關課程都沒有看過,也沒有嘗試寫過數據相關程式,不想投資時間和努力,就妄想靠著一本書成為數據專家的話,那我無法對這些只想尋找捷徑的人提出建言。因為,世上許多事情都是沒有捷徑的。
技術本身是中立的,習得技術和憑藉技術改善生活是兩碼子事。用 Excel舉例來說,會使用 Excel、運用 Excel 寫家庭收支簿,和運用家庭收支簿改善消費情形這三件事情,雖然彼此互有相關性,卻是不同的事情。並不是說學會Excel,生活就會有什麼改變。為了改善消費情況,開始記錄每日消費,並將紀錄結果分門別類,像這樣為了簡單計算各個項目而學習 Excel 的過程,和為了學習分析數據而去學習技術,才是同樣的道理。
我的這本書也和前作《解讀數據的技術》一樣,預設讀者想要藉由運用數據,來做出某些改變,以此為出發點撰寫。市面上已經有夠多的技術教學書籍了,技術本身當然很有意義,也有許多優秀人才在學到技術之後,轉而嘗試新事物。然而,並不是所有人都能成為技術專家,想要成為技術專家,只能投入大量的時間來提升能力。
希望本書能夠為「想要將數據運用到現實生活中的人」,帶來更多幫助。像是希望在工作業務上,採用更好方式做決定、希望透過數據和技術,為現實生活帶來一點變化的話,這本書裡頭,有我想給你們的一些建議。
當然,我說的並不一定是標準答案,也許有更好的方法,也許讀了這本書的你,會找到更適合自己的方式。這本書只是希望將我過去實際在公司分析數據、反映在決議上,並且成功帶來變化的經驗談,盡量用客觀角度和大家分享。
■ 和數據很熟,卻不知道如何運用
在韓國,一般大學生幾乎都會用Excel;無論是哪個行業的上班族,少說都會有過一次數據分析的經驗。只要是使用過「數據表格」的人,就算用的是再初階的技法,也可以稱得上是擁有「數據分析」的經驗。有了這樣的經驗,可能還會有「要做出更好分析」的想法。世界上很少有國家會像韓國這樣,有如此多的機會接觸到數據。
雖然韓國人處處有機會接觸數據,但實際上運用數據的態度卻很消極。大部分數據以數字呈現,而這些數字通常和成果、客觀性、評估等有很大的關聯。現代人早已被成績和排名壓得喘不過氣,數據對他們而言,彷彿是另一種壓力。一直以來沒有導入數據的行業,某天突然說要導入的話,就像是自己想要隱瞞的部分,要被公諸於世一樣,有種說不出口的恐懼感。人們會想:「我的工作將會被幾個數字評分,我的經驗和直覺會被視為主觀的偏見。」這也是現實中,許多企業會發生的情況。在用數字和指標客觀化的名目下,確實有些不同的觀點相對會被忽視,使其原本的意義黯然失色。
人類用如此五味雜陳的心態看待數據,一方面希望數據站在自己這邊,但又討厭被數據打分數;希望自己能夠好好運用數據,但又莫名覺得困難,想要找尋更簡單的方法;想要利用數據說得有條有理,但又害怕自我追求的價值可能無法數據化。
數據應該是用來協助自己的工具,不要讓它變成為自己打分數的工具。我們應該善用數據提供的線索,做出更好的決定,讓它能夠為市場和消費者帶來幫助。因此我們需要調整心態,讓自己慢慢克服對數據的莫名恐懼。
■ 設計漂亮的數據,用起來也很順手
學生時期,我修了不少和「實驗設計」相關的課程。實驗設計舉例來說,就像為了從統計層面證明某個現象,在特定部分進行特別處理,並和未經任何處理的群體做比較。整個課程內容包含了檢視整體的面貌,以及統計學方面的證明方法,以證明腦中所想的假設真實與否。這些課程對於奠定論文整體結構方向非常有幫助。
上班也需要進行實驗設計。別誤會,我不是要你在公司寫論文,我指的是,當在公司需要做出決定、需要理解消費者想法或檢視業績時,就是要用多重角度來檢視整體面貌。在整體面向中,數據所扮演的角色絕對無可取代。各式各樣的數據能夠說明多種現象,我們必須在這些單一的現象被用一句話下定論之前,再次檢視是否有遺漏的層面。
公司行號要如何正確理解消費者的心態?其實就如同我們看這頭大象,不能憑著消費者的某一個面向就妄下斷言。就像去年的消費者和今年的消費者可能又不一樣,若想理解消費者的整體面貌,就要用非常多樣的條件和層面觀察分析。
數據會告訴我們消費者留下的痕跡。消費者在什麼樣的環境下購買(或不購買)、更換產品的哪個部分會帶來更多銷售(或不會帶來銷售)、店面或位置、消費者特性等,都是數據,也都是輔助下決定的條件。
然而,今天如果只看單一個指標──也就是數據的某一個層面,很容易下錯決定,甚至可能比完全不看數據的情況還要糟糕。比起靠經驗和感覺下決定,全憑一個指標下的決定,可能更糟糕百倍。
如果要避免下錯決定,就要懂得設計數據。為了得到自己想知道的事情、專案方向、欲決定事項的解答,我們就得「計畫」檢視數據的方法。
這本書是為了說明如何善用數據,主要談的是「設計數據」。
第一章說明設計數據的方法、實驗設計,以及「細分想法」的方式。
第二章談用數據說故事的技巧。為了讓數據結果帶來變化,我們需要用數據說故事來說服他人。舉例來說,剛才的大象拼圖,當我們蒐集到所有的數據拼圖,接下來就是要畫出大象圖案,向他人說明。如果不像一般公司使用網站/App 商務平台的話,最好讓數據結果,能夠反映在和公司銷售有直接連結的商品或商店上,用這樣的方式來幫助下決定。為了達到此種理想的決議方式,愈能用數據說故事,數據結果就愈能貼近市場。
第三章則是談實際使用數據做決定的過程。我曾經在幾家公司有過靠數據做決定,並且帶來變化的經驗。本章節以數據科學家的角色,以及公司各部門關係的內容為主,敘述我自己的體會心得。這些經驗可能不一定適用於所有公司,但我還是會盡量綜合其他數據專家的經驗,談談幾個不同的公司,也有可能會出現的共同情況。
第四章要談的,是實際運用設計數據的方法。我將設計數據應用在《解讀數據的技術》一書中,出現的十個案例上。這些都是實際案例,但為了不列出特定公司或產品名字,已進行部分改寫。對讀者而言,百分百真實的案例可能會更有趣,但我可不希望將公司的業務機密,或非我個人成果的事情用來包裝宣傳。
希望這本書能夠提供想運用數據帶來實際變化的人些微幫助。在此聲明本書出現的案例,並非描寫特定企業或特定人物。