因此擔心自己或公司在資訊技術日益進步的時代淪為落伍者?
你覺得「大數據、機器學習」對你來說是「遙不可及」嗎?
你更憂慮不知道該如何下手?!
這本書就是來教你「具體該怎麼做」!
作者精心設計用最白話、最易懂的方式,一個步驟一個步驟地教你如何由網路收集資料、如何統計分析。
只有建立你自己的資料庫、活用大數據,
靠量化分析才能讓你做出最精準的判斷與決策,
無論你是否學過,只要有一部電腦或一台筆電!
這是一本任何人都學得會,並且做得到的大數據、機器學習之最佳入門書!
其實,任何背景的人要從網路下載大量資料,進行量化分析,甚至導入機器學習的方法,做更進一步的分析,都只要幾個小時的「苦練」。
市場上有關程式設計、甚至機器學習的書及課程很多,他們的目的是在教導讀者全面性的觀念,而你學會之後,再運用在你有興趣的地方。這樣很好,不過,對初學者而言較難。大多數人學會了之後,也不知如何運用。
本書則是以不同的方式編寫,作者先教你如何由網路上下載資料,再教你整理並分析的相關技術。我們會把所有的程式碼上網公布,方便你剪貼運用,你可以很快的用這本書的內容做資料收集及分析的工作(特別是量化分析)。
你不必成為程式設計師,但是至少要知道如何運用資訊科技來搜集並分析資料。而且雖然萬事起頭難,可是你一旦會用excel vba、簡單的機器學習工具來分析資料,你會發現再擴展到其他領域其實不是那麼難。你由此出發,有興趣再去補其他資訊科技之不足。
你可能會問為什麼要學會資料分析、機器學習的相關技術,好吧!俗氣的來說,這是當紅的技術。而且你如果把它運用在工作上,可以提升你或你公司的營運效率。
我想你應當受夠了和老闆及同事開會時各說各話的情況,決策全憑大家的「捷思」法,舉出版一本書的例子來說:我認為投資書要以投資系統為寫作主題,而你認為要寫名詞解釋的入門書比較好,雙方都可以自憑記憶找出佐證,但是由網站把所有書下載,比比看誰賣得好、誰出得多,在量化的基礎上不僅可以免除偏見,並有助於進行更進一步的討論。
現有軟體已經可以對固定化格式的資料進行大量的分析,不過,機器學習的技術可以讓資料分析有更高的可信度。一些需要人工判斷的資料,要先經過人工處理、分群,然後再加以分析。如果資料幾百筆,OK,你用人工分。但如果資料上萬筆呢?如此就要引進機器學習的技術,讓它替你分群,或是讓它學會你分群的邏輯,接手你的工作。
以上聽起來有點難,但是原理不難理解,本書也將提供入門的指引。
本書特色
◆專心於資料分析的資訊技術,減少學習的負擔
一般的上班族就算對資料的分析有需求,對程式的設計也沒有興趣,本書只討論有關資料取得、分析等方面的程式工具。有資料分析需求的讀者,學會這些就夠了,其他的有時間再深入。
◆大量的程式可供下載套用,拿來改一改就可以用了
分析網路資料大約有幾個部分:資料下載、資料整理、資料分析。其中運用到的程式語法說多不多,說少不少,一個一個重新打,很煩人。本書的所有程式碼都開放下載,你自己修改起來就方便許多。
◆作者成立讀者社群,提供相關資訊下戴,也有利於相互共同學習