大數據的價值與風險
作者 Viktor Mayer-Schonberger 和 Kenneth Cukier,前者是牛津大學網路研究所教授,後者是《經濟學人》雜誌資料編輯,此書出版以英文出版於 2013 年,後手上的為第一版的繁體中文翻譯本。全書旨在說明大數據分析將能提供預測,並且探討這工具會如何改變我們的生活、工作和思考。書中分為十章,分別探討大數據的現在與未來、風險與管控、價值與延伸意義、因果關係不再重要、一切都可資料化等。
兩位作者開宗明義,說明世界上的資料正在急速增長之中,甚至乎超過機器現時能處理的量,假如公元前三世的亞歷山大圖書館是當時知識的總和,現時擁有三百二十座圖書館的資料量。巨量資料需要達到足夠規模才可成事,從科學與社會帶來改變,然後會改變我們的生活、互動與思考方式。
其次,書中提出在大數據時代會有三大趨勢:能夠獲取和分析的資料量大增;不應堅持一切都精準;拋棄因果關係,而接納相關性。當統計學要求隨機抽樣,而大數據下不再抽樣,而用數據母體的完整資料集,理論不會終結,只是不會再從假說入手而已。資料數量比品質重要,而且在大數據下可能十分雜亂無章。
再者,作者認為巨量資料會為市場、社會和企業帶來價值,資料成為了生產要素來改變商業模式,比如沃爾瑪找到了颶風和小甜點的相關性來發財。資料化 (datafication) 與數位化 (digitalization) 不同,從文字到數字都在記錄世界屬前者,而數位化將資訊轉為機器可讀的格式。可以說是 Amazon 看到書籍數位化的價值,而 Google 則看到書籍的資料化價值。
此外,書中提出巨量資料的價值在於使用,而不是擁有,因此鼓勵授權給第三方使用,開放資料使其價值最大化。當然作者並不信奉不是大數據至上,更在書中後半部分討論其陰暗面,包括大數據改變了私隱的界線,現時的法律可能失守而需要按時代更替。