機器模型目的是要處理預測未知大量的資料,即使技術再進步、數學計算再複雜,很難說有一套完美無瑕且長久穩定的模型。正因為這個原因,這本書從源頭網路爬蟲取得原始資料開始,進而介紹如何利用Excel及Power BI進行分析,再利用Excel統計工具建立容易擴展的機器學習模型,得到大數據分析的結果。這個流程可以持續循環,隨時將最新資料整合到既有模型再測試修改。
例如在介紹機器學習中基本的K平均演算法分群。先從散佈圖開始介紹相關係數的概念,接著運用最小平方法進行線性迴歸,然後再透過Excel函數公式設計,以最小平方法演算距離進行分群,最後並且補充怎麼運用Excel規劃求解工具快速執行,有需要的話如何將資料標準正規化。
這個流程裡有很多拗口不是那麼容易親近的專業術語。但如果跟著本書一個步驟一個步驟操作演練,搭配書本的觀念講解和補充說明,相信就能開始領悟理論如何應用在實務案例。
更多閱讀請點我