進度條

萬物非聯(連)網就會有智慧,你不容錯過的智慧核心-機器學習

IoT的價值並非只在蒐集數據,而是把數據變成服務與應用方案。

作者: Vincent Ke 更新日期:

根據英國 IT Jobs Watch、Indeed 和 Stack Overflow 等三大機構統計中,不管是從人力職缺上還是薪資待遇,2018年物聯網絕對是不容小覷的一個趨勢,在上一篇文章裡我們已經為各位介紹了物聯網的基本架構,但只有聯網這件事情,絕對不是構成"服務"的要件之一,所有的感應裝置永遠在做的就是資料上的蒐集和處理,但如何把Data轉換成information和Knowledge,這中間的關鍵要素就是在現在另外一個火紅的項目"機器學習(Machine learning,ML)"

 

 

首先,ML的價值是什麼呢?大家都知道現在物聯網的應用非常廣泛,舉凡像是用掃描器掃描會員Barcode去紀錄消費,或是智慧冰箱、智慧空調等等,都是物聯網的實用案例,從感應裝置傳送到管理平台,結合應用程式的處理、分析,並在反饋出決策指引裝置做應用等,但關鍵點就在所謂的決策段了,也就是所謂的"決策支援"系統,那這和一般的數據分析有什麼不同呢?

 

傳統的數據分析在解釋數據這方面的確是相當稱職的一件事情,你可以利用過去的事件,來推估一樣的狀況發生在現在時,會發生什麼樣的狀況,也就是一種歷史的概念,舉凡像是一間餐廳,因為百分之80的用餐者都回覆說好吃,其中女性又佔七成,那我們可以判斷這是一間適合女性用餐的餐廳,對吧?這就是利用過去的資料來做分析模型的一種判斷,找出目標變數的相關性,來推測結果,也就是所謂的Data Mining

 

內置圖片 2

 

 

而這樣分析的精準度當然就會取決在所謂的分析資料量上囉,簡單來說,越多人說餐廳好吃,那這間好吃的可性度自然就會高囉,以電子商務的應用為例,大部分的男性購買衣服時身高超過180的都買L號,而且退貨率小於20%時,就代表你應該身高只要過180,選L號絕對正確吧!如果每一台新聞氣象都說明天下雨機率90%,那我想明天應該就會下雨吧?

 

當然,你可以依照過去發生的事件,以及影響變因去做交叉比對,在把今天發生的情況加入比對之中,來對接下來的使用行為做出判斷,並依據每一次的決策去做紀錄,但這樣的數據分析通常是靜態的,在處理快速變化和非結構化的數據面來說,使用程度是相當有限的,就像你把字彙都建進翻譯機之後,把句子KEY進去做翻譯,通常翻出來的東西很難做即時修正吧,特別是那種新興的專有名詞,如果沒辦法動態的捕捉這些詞彙,那翻譯出來的精準度一定會有所落差。

 

這點在物聯網也是一樣,因為資料寫入的感應裝置數量很多,並且可以和數以萬計的外部因素去做動態關聯,那靜態模型若是無法自我擴充的話,決策就會有失準的可能。

 

難道百分之八十的人評斷說好吃的店一定好吃嗎? 會不會是有促銷活動的影響呢? 還是其他因素的關聯? 難道大家都說會下雨,明天就不會事情天嗎?

 

所以在傳統的數據分析上,除了這些過去資料輔佐外,還會導入一些專家的決策做背書,並建立模型與數據變量之間做關聯。而機器學習是從變量(例如節能)出發,然後自動尋找預測變量及其相互作用,並去對模型做修正。

 

內置圖片 4

 

最簡單的一個實例就是我們常用的Google翻譯了,GOOGLE利用手邊龐大混亂的語彙資料集。並將其翻譯系統母體大至全球,廣達數十億個翻譯網頁來訓練電腦,其中的資料包含公司網站、多語系的國際報告、多語系的使用文件、說明書..等等,透過這樣的方式來提升翻譯的精準度,來預判出現"Good"之後,下一個英文字是"JOB"或是"Morning" 的機率有多高。

 

資料來源包含各公司網站、官方文件的多語翻譯,國際組織的多語報告,或是 Google 圖書掃描計畫,納入的書籍翻譯,甚至包含網上各種斷簡殘篇、品質參差不齊、混亂的資料。這樣一來,翻譯的準確度再度提升,甚至某個英文字之後,出現另外一個字的機率,都能夠計算出來,並透過回饋讓翻譯模型成長,變得更精準。

 

內置圖片 6

 

而目前的ML主要有兩大類別如下:

 

1、監督式學習 (Supervised learning):指在一組實例的基礎上開發一種演算法。例如智慧雨傘販售為例,可能是一個產品每天的銷售記錄。比方說雨傘在一天之中可以賣幾支,並推算何時可以自動補貨

 

2、非監督式學習 (Unsupervised Learning):結合其他資料,讓系統主動分析並探索銷售的關鍵因素,而非單純的日期與銷售的關係,例如下雨天造成雨傘的銷售影響狀況、是否會有本地事件(例如抗議用傘當象徵道具..等),來做出雨傘銷售量與這些因素關聯的關係。

 

若是以智慧家電為例呢?其物聯網資料分析的來源數據可能包含如震動,環境因素如溫度、語言、文字、影像辨識,或是用戶行爲等線上的數據,並結合一些開源資料做輔助,如天氣溫濕度、新聞等做交互使用,都是一些很好的例子 ,利如智慧冷氣可以判斷使用者的習慣,並結合室內外溫,來做幾度就會開冷氣的決策支援;而智慧冰箱可以依據使用者的採買習慣來了解青菜吃幾週會吃完..等等。

 

 

內置圖片 5

 

所以物聯網的數據分析及決策支援中,有幾個關鍵要素如下:

1.大量資料並導入專家的評判做關聯,讓資料庫變成知識庫,並導入自動化的規則來彙整應用

2.對資料做分析後抓取數個關鍵變數,以及變數特徵,

3.導入機器學習,結合演算法來驗證模型的精準度,將字動結果回饋到預測過程中的參數中,來達最佳化預測和決策支援

 

 

但無論如何,一個好的IoT並非是靠人為去做數據決策支援,而是應該要透過更系統化、更自動化的方式來讓產品的決策更為精準,而IoT本身的價值並非只是在蒐集數據,而是如何把數據變成服務,甚至是應用方案,才應該是IoT的核心。

 


最後,如果你喜歡我們的文章,別忘了到我們的FB粉絲團按讚喔!!

Medium vincent

Vincent Ke

喜歡把混亂的事情變的簡單 用嘴巴做事其實很可以 但要結合靈活的腦袋思考 就一起來拆解吧