推薦序
大數據戰略4.0:資源整合‧平台建置‧創意思維‧新創業態
近幾年,「大數據」議題備受所有的產官學研等矚目,不論是個人、企業、產業、社會、政府、教育、國家、乃至全球都深受其影響,乃因大數據本身的特性具有大量性(Volume)、即時性(Velocity)、多樣性(Variety)、以及不確定性(Veracity)等4V屬性,反映出大數據將對整個人類文明產生衝擊。
面對當前大數據所將帶來的變化,我們要如何因應呢?如何結合科技、社會科學和人文等各領域的知識,回應知識經濟時代的需求,歸納本書十二項主題、三十一位作者群的論述,總結《大數據戰略4.0》的四大戰略為:資源整合、平台建置、創意思維與新創業態等,以對應4V特徵的衝擊與挑戰。亦即巨量的資料代表著各方的資源,因此首要的戰略就是必須要能有效地整合;而基於即時性的挑戰,一個高效能且更開放的平台,必須快速建置,是第二項戰略;有了這些基礎之後,第三項戰略就是培植創意人才,也就是讓具有創意思維的元素加入整個戰略的發展,以有效運用、解讀、跨領域的應用大數據所帶給我們的多樣性特質;第四項戰略則是要執行「Big Data+」的策略,創造新創業態的形成。
本書的內容提供了十二大產業的具體案例與理論基礎,讓讀者能充分了解上述四大戰略綱領的精義,難能可貴。為因應大數據時代,大學教育的內涵與機制也需要與時俱進,不僅要能隨著時代潮流做必要的調整,更必須能透過卓越的學術研究與教學,引領潮流。臺大為國內歷史悠久、最具規模、學風自由、思想多元、領域均衡的大學,希望能夠培育出具備專業領域能力的學生,也期盼學生具有獨立思考和創新能力,因為創新才是臺灣能夠在未來常保競爭力的根基,能為臺灣的發展注入更多能量。故本校全面推動創造力與創新能力的教育,培養學生創新思考、解決問題,以及跨領域的創新設計與實作之能力,以成為具社會關懷有使命感的人才,能回饋貢獻人類社會,從而提升國家競爭力,讓臺灣能永續發展。
本書總編輯任立中教授於今年8 月接任本校統計教學中心主任暨統計碩士學位學程主任,便積極投入心力,進行必要之改造。希望本書中面對變革的策略能在校園校務中迅速落實,逐步推動,共同打造本校成為國際學術研究重鎮。
楊泮池
臺灣大學校長
推薦序
大數據戰略4.0
日前臺灣大學任立中教授攜來一本書籍草稿《大數據戰略4.0》,集結國內產學菁英就行銷、製造以至於地理、運動共計十二個領域大數據的應用,撰寫推動戰略,堪稱當今國內大數據應用的經典。
要推動大數據的發展,各界莫不摩拳擦掌、躍躍欲試,但也無不面臨人才、經驗、專業能力匱乏的挑戰。我們臺灣推動大數據,究竟應該採取什麼策略,才能在不落人後,甚至在國際上有一席之地?表面上來看,大數據是資通訊領域一個新的境界,應該是由資通訊來引領風潮。的確,國際上類如Google 等先進業者,因為本身營運所需而開發出不少異於傳統資料處理分析的技術與工具,而且以開放的態度在網路上提供各界使用,因而被認為是大數據應用的先驅。而傳統的資料處理與統計方法,也有被翻轉的跡象,因此我們應該密切追隨、急起直追。但是,進一步去想,其實Google 等企業之所以發展出這些技術,是基於解決本身大數據應用(搜尋)的問題。換言之,是被其特有的應用需求所驅動。
大數據的許多應用,其實是具有專屬性或地域性的,例如大數據在金融業、製造業的應用,臺灣與其他國家會有不同的地方。這些應用,如果我們自己不去推動,其他國家大概也不會有人會替我們推動。因此,在推動大數據的策略上,「應用導向」應該是毋庸置疑的事。而基礎技術與工具的研發,也應該是基於充分的應用經驗與需求來驅動,而不是一昧追求國際上的熱門題目,落入發表期刊論文的迷思。本人在行政院副院長、院長任內推動大數據的政策應用,如要說有一個最重要的心得,莫過於此一體會。
也因此,任立中教授編輯的這本書具有特別的意義。坊間不乏翻譯的國際大數據應用書籍,但是要切入臺灣應用的精髓,莫如本書。期待讀者能藉由此書,激發出更多的應用創意,讓臺灣的大數據應用,能在國際上引領風騷!
張善政
前行政院院長
東吳大學巨資學院榮譽院長
推薦序
大數據是21 世紀的新石油及新生產要素
「大數據」於當今社會的重要性與對產業的影響力,已不可言喻。美國歐巴馬政府將「大數據」視為「21 世紀的新石油」,是「挖不完的金礦」。《大數據》作者麥爾荀伯格教授更將「大數據」看成是未來企業除了人才與設備、土地外,最重要的生產要素。《經濟學人》也認為「大數據」會「比你更了解你自己」。在日本,軟銀機器人Pepper 透過大數據的分析,能夠辨識顧客表情,與人開心互動交談。因此有些人將「大數據」譬喻為舊時的指南針,現代的望遠鏡與雷達,能幫助企業掌舵,激發各種創新、創意與創價的可能,從而創造出更多商機與成功的機會。
「大數據」擁有巨量性(Volume)、即時性(Velocity)、多樣性(Variety)以及不確定性(Veracity)等4V屬性。數據的「大」與「多」並不重要,端看如何精煉與應用,從4V的特性中萃取其價值。「大數據」開闢了新境界,轉變人們對世界的基本理解,環看周遭發生的大變化,就會知道這場巨量資料革命已然開始。企業如果想要保持領先地位,確定未來的商業模式如何改變,決策者必須站在這「大數據」的浪頭上,樂觀而務實的看待資料革命,因應新局並有效掌握該淘金密碼,挖掘這龐大潛藏的價值。
「大數據」的應用是跨領域連結的,無遠弗屆。最近非常火紅的寶可夢(Pokémon GO)尋寶遊戲,帶動了擴增實境、遊戲、文創,以及穿戴裝置等相關產業商機,將地理大數據的應用發揮到極致,創造出新的「寶可夢經濟學」。
任立中教授主編的《大數據戰略4.0》鉅著,終於在千呼萬喚中具現,是完遂多年來臺灣管理學界一直希望有學者願意編著一本有理論基礎以及臺灣產業實務意涵的「大數據」中文書籍。
該書內容分為十二個章節,每個章節涵蓋兩部分,分別由該領域的頂尖研究學者以及產業專家撰寫相關「大數據」的理論與應用內容。包括行銷大數據、製造大數據、雲端大數據、醫療大數據、會計大數據、零售大數據、社群大數據、農業大數據、金融大數據、電商大數據、地理大數據、運動大數據等。內容豐富,架構完整,輔以經典「大數據」案例說明,讓讀者看懂了「大數據」的威力與偉大的應用。
例如,伊拉波疫情擴散的監控、PM2.5 的空污感測、交通流量的管控、商情分析與服務系統的建立等,都是地理大數據應用的典範案例。醫院利用醫療大數據,可進行疫情和健康趨勢分析、強化醫學研發與用藥精準醫療等功能;Deloitte 透過會計大數據,能有效降低專案承接風險,並利用「審計雲」以及班佛定律和視覺化分析,可成功提高審計績效;John Deere 在IBM 大數據平台系統支援下,分析天氣資料(如溫度、濕度)以及土壤資料(如酸鹼度、特殊元素濃度),預測不同時間點應使用的水量、種子與化肥,幫助農民規劃最適當的農耕路徑和灌溉方式,從而節省農機油耗和灌溉用水,就是最佳的農業大數據成功應用;Olli 無人駕駛迷你公車可配備人工智慧列車長,與乘客交談並建議乘客的最佳用餐地點及觀光景點,最後Olli 載乘客到最近的捷運站,便是製造大數據最佳的應用典範。
「資料庫行銷」是「大數據」應用最多與最具代表性的一門學科,本書總編輯任立中教授,二十多年前就率先在臺灣大學開設「資料庫行銷」,是全臺灣第一位講授此一門課程的學者。任教授目前任教於臺灣大學國企系,並擔任臺灣大學統計碩士學位學程暨統計教學中心主任,同時兼任中華應用統計學會理事長、台灣行銷科學學會秘書長等職,多年來熱衷於教學研究工作,有豐富的學術涵養與實戰經驗。任教授是專攻行銷管理與行銷研究的學者,尤其在行銷決策模式與資料庫行銷等主題研究,有非常卓越的成果與貢獻,近年來更有兩篇非常重要的文章分別發表在Journal of Marketing Research〈JMR〉與Journal of American Statistics Association〈Journal of JASA〉二大世界頂尖學術期刊。在臺灣行銷學術界,任教授是唯一在該兩大期刊發表論述的管理學者,也是第一位在行銷三大期刊〈JMR〉發表著作的臺灣研究學者,有非常崇高的學術地位。
《大數據戰略4.0》是任立中教授與多位傑出學者及產業菁英數年來知識智慧的累積,確實是一本「大數據」的知識與應用寶典,不管是教師、學生或各行各業有志從事「大數據」相關工作的專業人士,都值得投注時間仔細研讀,必能有所獲得。在此,本人樂意將這本經典好書推薦給讀者共享。
陳厚銘
臺灣大學國企系特聘教授兼科技部管理一學門召集人
自序
大數據戰略4.0:理論‧模型‧預測‧決策
洞人心扉.動人心扉
Read people’s minds. Touch their souls.
當開始籌畫本書內容的時候,放在會議桌上的第一個問題就是:「什麼是大數據4.0」?有人說數據就是數據,難道0 到9 十個數字還有四種不同的演進或寫法?其實自人類有歷史以來,結繩記事、干支記數,數據的蒐集、紀錄、彙整、分析與應用,是人類文明得以傳承、昇華之關鍵。所以,如果就「數據」的發展歷程來看,4.0 意味著四個不同的演進階段。
大數據1.0:在1970 年代以前,最早期的數據大多是將直接觀察到的現象,透過人工的方式加以記錄下來。此時的數據量以當今的標準當然是稀少到不足以掛齒,但以當時的條件,其量不可謂不巨大。重點是分析的方法大多是一種描述性的說明。譬如100 位工廠作業員的動作如何影響產量(資料量:100×2)。
大數據2.0:到了1980 年代開始,當人們可以更有系統地蒐集資料時,所需面對的資料除了量體的進一步增加,其複雜度亦逐步攀升。譬如衡量1,000 位消費者生活型態的問項有一百個變數(資料量:1000×100)。此時簡單的敘述性統計已無法有效萃取出有用的資訊,而須藉助較複雜的統計分析模型(例如:多變量統計分析),才得以幫助決策者獲得關鍵的資訊。
大數據3.0:電腦之發展於1990 年代開始成熟,資料庫的建置愈來愈普及。不僅記錄了成千上萬橫斷面資料的紀錄,更加入了時間的動態性。譬如記錄100 萬名會員消費者在過去365 天對於1 萬個產品的購買交易紀錄(資料量:1,000,000×10,000×365)。再譬如一個生產製程中,有3 萬個查核點,每個查核點有1 千個變數,每秒均產生一個紀錄。一年下來的資料量:30,000×1,000×60×60×24×365=946,080,000,000,000。可想而知,此時單純的多變量或時間序列的統計分析模型,已不足以掌握此種整合縱斷面與橫斷面資料(簡稱縱橫資料Panel Data)之複雜性。更新更複雜的現代統計理論,結合更快速的電腦計算模擬功能,迅速發展成為大數據推波助瀾之關鍵因素。
大數據4.0:網際網路從2000 年開始,步入全面性的變革,再加上2010 年以後,移動通訊的深化,社群媒體的興起,使得原本就已經龐大的數字資料庫,更加上文字、語音、影像等超級複雜的資料型態,形成了現今所謂的「大數據」現象。然而,不管大數據的膨脹是多麼得令人難以想像與掌控,我們要面對的核心問題仍然一樣:如何靠更精密的統計分析模型,以及更快速的計算功能,以協助決策者獲得所需之關鍵的訊息。
因此,除了上述從數據的演化階段說明大數據4.0 之意義外,我們對於如何協助決策者獲得所需之關鍵的訊息,需要一個4.0 版的戰略框架的角度,來說明「大數據戰略4.0」的新義。這個框架涵蓋了四大構面:理論、模型、預測與決策。這四大構面是我們作者群幾次編輯會議中,對於有關大數據紛紛擾擾、形形色色的標籤、口號下,反覆討論之後,所歸納整理出它們的經與緯。首先,「大數據戰略」之目的為何?歸根結底就是要解決問題,解決決策者所面對的問題。而任何解決問題的架構流程,一定是先有一個理論基礎,告訴我們問題背後的邏輯與思路,然後將之建構成一個模型,通常是統計模型。在模型中所定義的變數以及變數與變數之間的關係,便是反映或呈現這套邏輯與思路。模型建立好之後,透過檢驗與實證,便可進行模擬與預測。決策者再根據預測所得之結果進行最終的決策。而在實務運作上,大數據戰略的第一步是先問我們所需做的決策是什麼?為了做這個決策,我們必須預知可能的結果以便於評估其後果;而為了能得到這個預測的結果,需要決定採用何種模型。而在建構模型的時候,要非常清楚與掌握有那些理論可以支持與解釋。
最後,我們上述宏觀大框架的層次,聚焦至微觀的資料的特性。大數據4.0 代表著未來我們在分析任何的數據,有四大特點或趨勢值得注意。
1. Not all data is created equal. 每一個資料點對於分析關鍵訊息時,其貢獻度(或重要性)並不是相同的。譬如有些人的意見比較重要,或是越靠近目前時間點的資料,在分析上,與其他的資料點就不能等量齊觀。
2. Not all data comes from same distribution. 傳統統計的基本假設均設立所有資料來自同一個母體時,便認為這些資料服從同一個分配(譬如常態分配)。但是,由於大數據的龐雜性,使得傳統模型的可靠度大幅降低。
3. Not all data can be observed. 所有可以被觀察、被記錄的資料,往往是表面的一種現象。而真正對於決策者有用的資訊,往往是隱藏在這些資料的背後。譬如消費者日常購買的食品交易紀錄便隱藏著熱量消耗的健康生活型態訊息。
4. Not all data is objective and unbiased. 在大數據中,並不是所有資料均是客觀的和無偏誤的。最明顯的例子是輿情分析中的文字探勘技術。如果資料本身就存在可能的偏誤時,任何精密的分析可能都徒勞無功了。
以上我們從三個方面:四種數據演進的歷程、四個數據戰略框架的元素、以及四項大數據分析特質的挑戰;定義4.0 之意涵。因此,本書以「大數據戰略4.0」為標題,總攬了大數據在十二大產業的理論、模型、預測與決策的探討。希望讀者能以此觀念架構閱讀各章節之內容,以便於吸收、消化。達到透視大數據之內涵,有效掌握其隱含之資訊,提升決策品質之目標。
唯有洞察人心於前,才能動人心扉於後。
任立中
臺灣大學統計碩士學位學程暨統計教學中心主任
臺灣大學全球品牌與行銷研究中心主任
臺灣大學管理學院國際企業學系行銷教授
台灣行銷科學學會秘書長
台灣行銷科學學報總編輯
中華應用統計學會理事長